我需要过滤掉字符串中的锚标签。例如,
看看这个网站:<a href="http://www.stackoverflow.com">stackoverflow</a>
我需要能够过滤掉锚标记:
看看这个网站:http://www.stackoverflow.com
这种格式也可能不是一成不变的。锚标记可能还有其他属性。此外,字符串中可能有超过 1 个锚标记。在进入数据库之前,我正在 vb.net 中进行过滤。
这是一个应该可以工作的简单正则表达式。
Imports System.Text.RegularExpressions
' ....
Dim reg As New Regex("<a.*?href=(?:'|"")(.+?)(?:'|"").*?>.+?</a>")
Dim input As String = "This is a link: <a href='http://www.stackoverflow.com'>Stackoverflow</a>"
input = reg.Replace(input, "$1", RegexOptions.IgnoreCase)