c# - 使用 HTMLAgilityPack.dll 读取 XHTML 文件

Question

我正在研究 C#（基于 Windows 窗体）项目。它需要从 XHTML 文件中读取内容。XHTML 文件存储在本地驱动器上而不是 Web 上。是否可以使用“HTMLAgilityPack.dll”读取 XHTML 页面的内容（无标签）？如果没有，还有其他解决方案吗？

谢谢; 马尤雷什。

score 0 · Accepted Answer

是的你可以。我正在使用那个库，它工作正常。它公开了一个类似于 .NET 的 System.Xml.XmlDocument 类的 API，但显然所有内容都以 Html 为前缀。可以使用 XPath 查询 HTML 文档树，就像 XML 文档一样。

score 0 · Accepted Answer

如果保证文件是有效的 XHTML（即 XML），那么我将使用System.Xml.XmlDocument.

我似乎记得 HtmlAgilityPack 读取 HTML 文档并尽力使其成为 XHTML。然后，您可以使用其 DOM 处理文档并使用 XPath 选择元素。

2 回答 2