13

有没有类似的库BeautifulSoupfor C#

我想简单地解析 HTML 和 XML,特别是有错误的 HTML。

4

1 回答 1

10

我过去使用HTMLAgilityPack取得了一些成功,但它在解析格式错误的 HTML 或缺少结束标签时遇到了一些问题。不过那是大约 2 年前的事了。

我通常倾向于使用SGMLReader,它允许您使用 XML Reader 包装它,因此您可以轻松地在 C# 中使用 XDocument 或 XmlDocument 来读取 HTML。SGMLReader 已经处理了我扔给它的所有格式错误的 HTML。

于 2012-11-30T19:58:22.443 回答