我在使用正则表达式匹配 http 链接时遇到问题。我有一个模式,我想从网站源代码中提取。源代码有 200 多行,其中包含大量 HTML 乱码,例如</html><body... useless links useless images'
我需要的 http 链接属于这种模式:
<a href"http:www.google.com/....1,1">
<a href"http:www.google.com/....2,2">
<a href"http:www.google.com/....3,3">
我只想获取 http 链接,它们的独特模式是结尾。请帮忙,我在 gusb、regxpr 和 grep 的实验中被困了好几个小时。