使用 C# 的 HTMLAgilityPack,我将如何从 HTML 中获取内部文本,而不是来自<h1-6>
. 我不想使用正则表达式,而是 HTMLAgilityPack。
我目前的做法:
var document = new HtmlDocument();
document.LoadHtml (text);
text = document.DocumentNode.SelectSingleNode ("//body").InnerText;
这有问题,并且在处理大量文本时不太有效。最好删除标题标签,然后抓取内部文本。
谢谢!