0

我有一个表格,其中包含数百个带有屏幕截图的指南。屏幕截图图像被锚标签包围,因为它们以前是可点击的,但现在我需要删除锚标签。所有要删除的锚标记都有一个href=#screenshot后跟一个数字,如下例所示。我的计划是使用 mysqldump 转储表,然后使用sed查找和替换正确的字符串。

<p>Choose <a href="/components">components</a> to install and click next.</p>
<div class="screen">
<a href="#screenshot3"><img src="/images/screens/install/step3.jpg" alt="Step 3"></a>
</div>

应该

<p>Choose <a href="/components">components</a> to install and click next.</p>
<div class="screen">
<img src="/images/screens/install/step3.jpg" alt="Step 3">
</div>

我可以使用匹配第一个标签,<a\shref\=\"#screenshot\d+\"\>但我还需要匹配它的第二个结束标签,以便可以删除两者,同时不删除其他锚标签。任何帮助将不胜感激!

4

1 回答 1

1

您可以尝试更换

<a\shref\=\"#screenshot\d+\"\>(.*)<\/a>

\1.

括号将捕获它们之间的所有内容,因此您可以使用\1, \2...

请记住,虽然正则表达式不是尝试修改 HTML 时使用的正确武器。阅读本文(及其周围的评论)以获得解释。

于 2013-03-02T09:19:32.243 回答