我正在使用包含不间断空格的 Html Agility Pack 在 c# 中解析 html 表。
HtmlDocument doc = new HtmlDocument();
doc.LoadHtml(page);
 
其中 page 是包含文本中特殊字符的表格的字符串。
<td> test</td>
<td>number = 123 </td>
使用SelectSingleNode(".//td").InnerText
will 包含这个特殊字符,但我想忽略它们。
是否有一些优雅的方法可以在不修改源表的情况下忽略这一点(有或没有 Html Agility Pack 的帮助)?