0

我想从 HTML 代码中获取所有网站。问题是我有一个正则表达式,它接受所有的 URL,但www地址中需要有。我需要使用哪种正则表达式来获取www内容中没有的 URL?

更新:我使用的正则表达式是:

string anchorPattern = 
  @"(?<Protocol>\w+)://(?<Domain>[\w@][\w.:@]+)/?[\w.?=%&=\-@/$,&amp;+]*'";
4

2 回答 2

1

仅为具有 www 的网址添加 (?=www)

@"(?<Protocol>\w+)://(?=www)(?<Domain>[\w@][\w.:@]+)/?[\w.?=%&=\-@/$,&amp;+]*"

或添加 (?!www) 以表示没有 www 网址

@"(?<Protocol>\w+)://(?!www)(?<Domain>[\w@][\w.:@]+)/?[\w.?=%&=\-@/$,&amp;+]*"
于 2012-05-17T21:09:14.283 回答
0

一个像你一样,但没有看起来像的正则表达式部分www\.

于 2012-05-17T20:29:34.357 回答