0

我正在寻找可以在 C# 中用于 HTML5 文档的 DOM 实现。

要求是:

  • 解析 HTML5
  • 通过某种方式查询 DOM
  • 操作 DOM(创建和注入节点、删除节点、移动节点、合并/嵌套其他 DOM)
  • 以字符串形式获取操作后的 DOM
  • 理想情况下,该库将处于积极开发中

注意:我知道 Html Agility Pack,但是我很想看看我是否还有其他可用的选项,因为它自 2010 年以来就没有维护过。

4

1 回答 1

1

另一种选择是尝试使用同样托管在GitHub 上的SgmlReader使 html5 格式正确。看起来对 master 分支的最新提交是 11 个月前。

SGMLReader 是由 Chris Lovett 编写的用于解析 HTML/SGML 文件的多功能 C# .NET 库。

它试图将格式错误的 html 文档转换为格式正确的 xml 文档。然后,您可以根据自己的选择手动操作文档。

于 2012-05-07T13:48:45.017 回答