给定一个 HTML 文档,我想识别文档中的所有数字并在数字周围添加自定义标签。现在,我使用以下内容:
HtmlNodeCollection bodyNode = htmlDoc.DocumentNode.SelectNodes("//body");
MatchCollection numbersColl = Regex.Matches(htmlNode.InnerText, <some regex>);
一旦我得到 numbersColl,我就可以遍历每个 Match 并获取索引。但是,我无法更改 InnerText,因为它是只读的。我需要的是,如果 match.Value = 100 和 match.Index=25,我想将 25 替换为
<span isIdentified='true'> 25 </span>
对此的任何帮助将不胜感激。目前,由于我无法修改内部文本,我必须修改 InnerHtml 但某些元素的 innerHtml 中可能有 25 个。那不应该被触及。但是我如何识别数字是否在 html 标签内,即 <table border='1' > 在标签中有 1。