如何通过 C# 中的正则表达式从任何特殊标签中清除 HTML?
这是需要删除的示例 HTML<font size="-2">
R&usg=AFQjCNFYiDC6u3xOGn4JpO-GF83PjdSbtw&url=http://online.wsj.com/article/SB10000872396390444426404577647060576633348.html"><img src="//nt2.ggpht.com/news/tbn/bm6jvTMtF-PpnM/6.jpg" alt="" border="1" width="80" height="80" /><br /><font size="-2">Wall Street Journal</font></a></font>
</td>
我知道我们必须以某种方式使用正则表达式,但我不知道如何使用它。
我曾尝试调整此方法,但它会清除所有标签。
public string Strip(string text)
{
return Regex.Replace(text, @”<(.|\n)*?>”, string.Empty);
}
事实上,我正在寻找一些方法来做这样的事情
public string Strip(string text, HTMLTags.Font)
{
}
HTMLTags.Font
一些 HTML 标记的枚举在哪里
enum HTMLTags
{
Font,
Div,
Td
...
}
谢谢你的任何线索!!!