我有一个表格,其中包含数百个带有屏幕截图的指南。屏幕截图图像被锚标签包围,因为它们以前是可点击的,但现在我需要删除锚标签。所有要删除的锚标记都有一个href=#screenshot
后跟一个数字,如下例所示。我的计划是使用 mysqldump 转储表,然后使用sed查找和替换正确的字符串。
<p>Choose <a href="/components">components</a> to install and click next.</p>
<div class="screen">
<a href="#screenshot3"><img src="/images/screens/install/step3.jpg" alt="Step 3"></a>
</div>
应该
<p>Choose <a href="/components">components</a> to install and click next.</p>
<div class="screen">
<img src="/images/screens/install/step3.jpg" alt="Step 3">
</div>
我可以使用匹配第一个标签,<a\shref\=\"#screenshot\d+\"\>
但我还需要匹配它的第二个结束标签,以便可以删除两者,同时不删除其他锚标签。任何帮助将不胜感激!