需要从包含大量条目、一些 .com .us 等的文件中提取 .co.uk 网址。我只需要 .co.uk 的网址。有什么办法吗?PD:我正在学习 bash
编辑:
代码示例:
<a href="http://www.mysite.co.uk/" target="_blank">32</a>
<tr><td id="Table_td" align="center"><a href="http://www.ultraguia.co.uk/motets.php?pg=2" target="_blank">23</a><a name="23"></a></td><td id="Table_td"><input type="text" value="http://www.ultraguia.co.uk/motets.php?pg=2" size="57" readonly="true" style="border: none"></td>
注意一些重复
重要:我也需要所有链接,损坏或 404
在网上的某处找到了这段代码:
cat file.html | tr " " "\n" | grep .co.uk
输出:
href="http://www.domain1.co.uk/"
value="http://www.domain1.co.uk/"
href="http://www.domain2.co.uk/"
value="http://www.domain2.co.uk/"
认为我很接近
谢谢!