0

我正在将网站转换为 PDF,但其中有图像,并且所有图像中都有一个文本,单击该文本可让您自行生成图像。

我认为这将是负责显示该文本的代码,因为我在其中一个文件中删除了它,并且不再显示文本和链接。

<div class="v1"><a target="_self" href="images/graphics/1.jpg">[View full size image]</a></div>

问题是大约有 200 多个包含此类似文本的 HTML 文档,只是更改了href.

是否有任何简单的方法可以摆脱这一切而不必一一进行?也许是一个正则表达式sed

4

2 回答 2

1

如果表达式总是在一行并且唯一的区别在于href,sed是一个可能的解决方案:

sed -e 's,<div class="v1"><a target="_self" href="[^"]*">\[View full size image\]</a></div>,,' 

我使用了另一种分隔符,,因此/不必在结束标签中转义。但是,链接文本中的括号需要转义。

于 2012-10-23T09:44:38.167 回答
0

是的,正则表达式可能是这里最简单的解决方案。如果只是从所有文件中删除这一行的问题,那么我只需在编辑器中打开它们(Sublime Text 2做得很好)并执行正则表达式搜索和替换。以下搜索模式可能会起作用:

<div class=\"v1\"><a target=\"_self\" href=\"[^"]+\">\[View full size image\]</a></div>

于 2012-10-23T09:39:49.270 回答