解决问题的最好方法是更改字符<
(<
无需更改字符>
)
要知道字符何时<
是标记,以及何时“小于”,您可以使用if
此处的代码询问:
public static string CreateCorrectHtmlDoc(string htmlDoc)
{
int i = 0;
List<int> index = new List<int>();
try
{
//look for '<'
while ((i = htmlDoc.IndexOf("<", i)) != -1)
{
i += 1;
//regex to find '<' that is no tag
if (Regex.IsMatch(htmlDoc[i].ToString(), "\\d|-") || Regex.IsMatch(htmlDoc[i].ToString(), "[^a-zA-Z!]") && Regex.IsMatch(htmlDoc[i + 1].ToString(), "\\d\\s|-|\\d"))
{
htmlDoc = htmlDoc.Substring(0, i - 1) + "<" + htmlDoc.Substring(i + 1);
}
}
}
catch
{
Log.Insert("Error: CreateCorrectHtmlDoc");
return "";
}
return htmlDoc;
}
我正在使用它,它工作得很好