我正在研究 C#(基于 Windows 窗体)项目。它需要从 XHTML 文件中读取内容。XHTML 文件存储在本地驱动器上而不是 Web 上。是否可以使用“HTMLAgilityPack.dll”读取 XHTML 页面的内容(无标签)?如果没有,还有其他解决方案吗?
谢谢; 马尤雷什。
我正在研究 C#(基于 Windows 窗体)项目。它需要从 XHTML 文件中读取内容。XHTML 文件存储在本地驱动器上而不是 Web 上。是否可以使用“HTMLAgilityPack.dll”读取 XHTML 页面的内容(无标签)?如果没有,还有其他解决方案吗?
谢谢; 马尤雷什。
是的你可以。我正在使用那个库,它工作正常。它公开了一个类似于 .NET 的 System.Xml.XmlDocument 类的 API,但显然所有内容都以 Html 为前缀。可以使用 XPath 查询 HTML 文档树,就像 XML 文档一样。
如果保证文件是有效的 XHTML(即 XML),那么我将使用System.Xml.XmlDocument
.
我似乎记得 HtmlAgilityPack 读取 HTML 文档并尽力使其成为 XHTML。然后,您可以使用其 DOM 处理文档并使用 XPath 选择元素。