我想去除 Span 标签的 html 字符串。
我有一个 html 字符串:
<a href=\"http://www.dr.dk/roskilde\"><span>Roskilde</span><span>Festival</span></a>
我需要将其简化为:罗斯基勒音乐节。
Atm,我有一个正则表达式字符串,它应该能够找到所有跨度标签,但它失败了
System.Collections.Specialized.StringCollection sc = new System.Collections.Specialized.StringCollection();
sc.Add(@"/<\s*\/?\s*span\s*.*?>/g");
foreach (string s in sc)
{
k = System.Text.RegularExpressions.Regex.Replace(pContent, s, "", System.Text.RegularExpressions.RegexOptions.IgnoreCase);
}
k = System.Text.RegularExpressions.Regex.Replace(pContent, @" ", @" ");
有任何想法吗?
PS 我不想使用 Html Agility Pack