我有一个通过删除 html 来修改的数据表。在 html 条带期间,如果遇到或<br>
,则将其替换为。我正在将 html strip 进程的实例记录到文本文件中,并且格式在日志中看起来很好(所有 CRLF 都被保留)。但是,当在数据表上调用更新方法并将数据发送到数据库时,CRLF 字符都消失了。<p>
<li>
System.Environment.NewLine
代码片段:
public static class HtmlStripper
{
static Regex _htmlRegex = new Regex("<.*?>", RegexOptions.Compiled);
static Regex _liRegex = new Regex("<li>", RegexOptions.Compiled);
static Regex _brRegex = new Regex("<(br)?(BR)?\\s?/?>\\s*", RegexOptions.Compiled);
static Regex _pRegex = new Regex("</?[phPH].*?>\\s*", RegexOptions.Compiled);
public static string StripTagsRegexCompiled(string source)
{
string noPorH = _pRegex.Replace(source, System.Environment.NewLine);
string noBr = _brRegex.Replace(noPorH, System.Environment.NewLine);
string noLi = _liRegex.Replace(noBr, System.Environment.NewLine + "t- ");
return _htmlRegex.Replace(noLi, string.Empty);
}
}