3

我正在使用 AngleSharp 解析文档。我有一个文本节点(NodeName:“#text”),我想在其中插入一些 HTML。我当然可以将 NodeValue 重置为我想要的任何值,但它仍然是一个文本节点,所以所有的括号都被转义了。

如何获取文本节点的字符串值,将一些 HTML 注入其中,然后解析 DOM 表示该 HTML 代替原始文本节点?

4

1 回答 1

5

我猜你想要的是用多个节点替换单个文本节点。

例如<div>foo</div>,即

+ root
  + textnode

变成

+ root
  + textnode (1)
  + element
  + textnode (2)

这可以<div>f<b>o</b>o</div>。我能想到的最简单的方法就是替换节点。

var source = @"<div>foo</div>";
var parser = new HtmlParser();
var document = parser.Parse(source);
var div = document.QuerySelector("div");
div.InnerHtml = div.InnerHtml.Replace("foo", "f<b>o</b>o");

现在你可以争辩说仅仅替换文本可能不是你想要的。您可能已经有要插入的元素。因此,更好(但更复杂)的方法是拆分文本节点并插入剩余内容。

var source = @"<div>foo</div>";
var parser = new HtmlParser();
var document = parser.Parse(source);
var div = document.QuerySelector("div");
var text = div.TextContent;
div.RemoveChild(div.FirstChild); // assuming there is only one child
var bold = document.CreateElement("b");
bold.TextContent = text.Substring(1, 1); //o
div.Append(
    document.CreateTextNode(text.Substring(0, 1)), //f
    bold,
    document.CreateTextNode(text.Substring(2, 1)));//o

根据您的用例,可能会有更简单的解决方案。

于 2015-10-12T07:02:49.653 回答