我不擅长正则表达式,这就是为什么发布这个。我有代码来获取所有 url 以及来自 html 的所有电子邮件。但我需要以下内容。我可以使用以下获取所有网址:
Regex regx = new Regex("http://([\\w+?\\.\\w+])+([a-zA-Z0-9\\~\\!\\@\\#\\$\\%\\^\\&\\*\\(\\)_\\-\\=\\+\\\\\\/\\?\\.\\:\\;\\'\\,]*)?",
RegexOptions.IgnoreCase);
MatchCollection ms = regx.Matches(body);
foreach (Match m in ms)
{
string tmpLink = m.Value.ToString();
}
现在我想进一步匹配它是否包含 www 之后的数字。所以我会将它标记为垃圾邮件。或者可以有一个完整的代码而不是这个内部循环。电子邮件也是如此,获取那些在@之后有数字的电子邮件。