我需要提取字符串中的 url。
在我的情况下,html 文本在数据库中,当我得到该文本并需要在文本中查找所有 url 并插入到另一个表中时,你能给我一种在 SQL 或 C# 中查找 url 的方法吗?
这是在文本中查找 url 的正则表达式
Regex regx = new Regex("http://([\\w+?\\.\\w+])+([a-zA-Z0-9\\~\\!\\@\\#\\$\\%\\^\\&\\*\\(\\)_\\-\\=\\+\\\\\\/\\?\\.\\:\\;\\'\\,]*)?", RegexOptions.IgnoreCase);
MatchCollection mactches = regx.Matches(txt);
一种可能的方法是使用正则表达式。第一个选项是从数据库中提取 HTML,然后使用正则表达式直接查找链接。第二个选项是首先定位链接标签,然后从中提取 url(再次使用正则表达式)。
在这里您可以找到有关如何在 C# 中使用正则表达式的信息:http: //msdn.microsoft.com/en-us/library/system.text.regularexpressions.regex.aspx
另一方面,编写正确的正则表达式可能并不那么容易(这取决于 URL 的复杂程度),但您应该看看这个问题:regular expression for url
此外,在这里您可以找到很多关于一般正则表达式的信息(请记住,有一些应用程序,如 RegexBuddy,在测试正则表达式时可以为您提供很多帮助):http://www.regular -expressions.info/