我正在尝试使用正则表达式从某些 HTML 中获取 URL,但它不起作用。
<h3 class="(.*?)"><a onmousedown="(.*?)" href="(.*?)">(.*?)</a></h3>
有人可以帮我解释一下吗,我不是最擅长正则表达式的,我想看看我哪里出错了。
编辑:
我不是从任何地方“抓取”代码。我很早就知道正则表达式,但我从来没有做过很多事情,我认为它可以在这个项目中派上用场,所以我试了一下。这是我的代码:
static void Main(string[] args)
{
WebClient wc = new WebClient();
String html = wc.DownloadString("http://www.example.com/");
foreach (String result in match("<h3 class=\"(.*)\"><a onmousedown=\"(.*)\" href=\"(.*)\">(.*)</a></h3>", html))
{
Console.WriteLine("result: " + result);
}
Console.ReadKey();
}
public static ArrayList match(string regex, string html, int x = 0)
{
ArrayList l = new ArrayList();
foreach (Match m in new Regex(regex, RegexOptions.Multiline).Matches(html))
{
l.Add(m.Groups[x].Value);
}
return l;
}