我有一些混合了文本和链接的html,我想提取文本与链接的单词一样,而不必删除链接并稍后做一些疯狂的事情将其放回同一个地方。
HTML 如下所示:
<div id="i want what is inside here">
<h3>some text</h3>
<div>more text with a <a href="url">link</a></div>
<p>some more text<br />
<a href="url">another link</a> here...</p>
</div>
我想要的输出是:
some text
more text with a <a href="url">link</a>
some more text
<a href="url">another link</a> here...
我知道如何使用 HTMLAgilityPack 提取文本最近我学到了很多关于如何使用祖先的新东西,先于 xpath 和其他一些东西,这让我想知道:
是否可以使用 xpath 来获得上述所需的输出,或者我应该怎么做?
如果没有可用的 xpath 条件,我正在考虑提取文本然后提取链接并用链接替换文本上的链接内部文本匹配(我认为不可靠)但这是我认为可能的一种方式完成了,你会建议我做什么?