0

我需要解析一个巨大的页面......有一些这样的字符串:

<li class="specialclass"><a href="http://some.changingurl.com" ..(some changing classes)..>

我需要将以上内容更改为:

<li class="specialclass">http://some.changingurl.com<a href="http://some.changingurl.com" ..(some changing classes)..>

然后稍后我可以删除所有 html 标签,但保留 url。只有网址在变化。

请帮我写一个替代品。

谢谢你。

4

1 回答 1

0
sed -r 's/<a href="([^["]*)"/\1&/' input-file >new-file 

这个 oneliner 可以解决问题。

于 2012-07-17T01:42:34.763 回答