我想从 HTML 代码中获取所有网站。问题是我有一个正则表达式,它接受所有的 URL,但www
地址中需要有。我需要使用哪种正则表达式来获取www
内容中没有的 URL?
更新:我使用的正则表达式是:
string anchorPattern =
@"(?<Protocol>\w+)://(?<Domain>[\w@][\w.:@]+)/?[\w.?=%&=\-@/$,&+]*'";
仅为具有 www 的网址添加 (?=www)
@"(?<Protocol>\w+)://(?=www)(?<Domain>[\w@][\w.:@]+)/?[\w.?=%&=\-@/$,&+]*"
或添加 (?!www) 以表示没有 www 网址
@"(?<Protocol>\w+)://(?!www)(?<Domain>[\w@][\w.:@]+)/?[\w.?=%&=\-@/$,&+]*"
一个像你一样,但没有看起来像的正则表达式部分www\.