4

我有一些代码可以删除所有 html 标签,但我想删除所有 html,但</td>标签除外</tr>

如何才能做到这一点?

public string HtmlStrip( string input)
{
    input = Regex.Replace(input, "<input>(.|\n)*?</input>", "*");
    input = Regex.Replace(input, @"<xml>(.|\n)*?</xml>", "*"); // remove all <xml></xml> tags and anything inbetween.  
    return Regex.Replace(input, @"<(.|\n)*?>", "*"); // remove any tags but not there content "<p>bob<span> johnson</span></p>" becomes "bob johnson"
}
4

2 回答 2

6

正则表达式不适用于解析 XML 或 HTML。看看 HTML 敏捷包

HTML 敏捷包

于 2013-03-21T20:41:34.460 回答
0

删除所有标签 html,但标签 td 和 tr 除外

input = Regex.Replace(input, @"<(?!td|/td|tr|/tr).*?>", "");

于 2018-10-23T08:54:54.303 回答