以下行来自阅读的网页,我正在从页面中提取我们网站的网址。我可以提取大部分内容,但其中一些看起来像下面的那个。
"javascript:outside('http://www.xyz.com/graduation.html')";
我希望能够提取以 http://....... 开头的链接
尝试了正则表达式和拆分字符串,但无法正确处理。谢谢
使用正则表达式轻松完成。
(?<=javascript:outside\(\')http://[^']*(?=\'\))
...像这样:
var src="javascript:outside('http://www.xyz.com/graduation.html')";
var match=Regex.Match(src,@"(?<=javascript:outside\(\')http://[^']*(?=\'\))");
if(match.Success)
{
Console.WriteLine(match.Value);
}