我正在寻找可以在 C# 中用于 HTML5 文档的 DOM 实现。
要求是:
- 解析 HTML5
- 通过某种方式查询 DOM
- 操作 DOM(创建和注入节点、删除节点、移动节点、合并/嵌套其他 DOM)
- 以字符串形式获取操作后的 DOM
- 理想情况下,该库将处于积极开发中
注意:我知道 Html Agility Pack,但是我很想看看我是否还有其他可用的选项,因为它自 2010 年以来就没有维护过。
另一种选择是尝试使用同样托管在GitHub 上的SgmlReader使 html5 格式正确。看起来对 master 分支的最新提交是 11 个月前。
SGMLReader 是由 Chris Lovett 编写的用于解析 HTML/SGML 文件的多功能 C# .NET 库。
它试图将格式错误的 html 文档转换为格式正确的 xml 文档。然后,您可以根据自己的选择手动操作文档。