我正在尝试使用 AngleSharp 库来解析一些 HTML,到目前为止它非常棒。我现在偶然发现了一个我想解析以下 HTML 的场景:
<a name="someLink" href="#someLink">Link 1</a>
Some text that happens to be in between elements...
<b>Some stuff in bold</b>
Some more text
<br>
当然,这段 HTML 有封闭的父元素等,但是这段 HTML 的解析元素的结果列表是:
- HtmlAnchorElement
- HtmlBoldElement
- HtmlBreakRow 元素
有效地跳过元素之间的文本。如何获取此文本?我认为 AngleSharp 会为这些部分生成 TextNodes 吗?
请注意,获取父级的完整 TextContent 不是我想要做的,因为我实际上仍然需要元素的结构来知道什么是什么。