3

可能重复:
在 C# 中解析 html 的最佳方法是什么?

有没有办法解析 HTML 或将 HTML 转换为 XML,以便我轻松地从网站中提取信息?

我正在使用 C#。

谢谢,

4

2 回答 2

5

HTMLAgilityPack是您正在寻找的。查看本教程使用 HTMLAgilityPack 解析 HTML 文档

于 2012-07-03T04:24:29.407 回答
5

您可以使用其中的 COM 对象Microsoft HTML Object Library来加载 HTML,然后使用它的对象模型进行导航。一个例子如下所示:

string html;
WebClient webClient = new WebClient();
using (Stream stream = webClient.OpenRead(new Uri("http://www.google.com")))
using (StreamReader reader = new StreamReader(stream))
{
  html = reader.ReadToEnd();
}
IHTMLDocument2 doc = (IHTMLDocument2)new HTMLDocument();
doc.write(html);
foreach (IHTMLElement el in doc.all)
  Console.WriteLine(el.tagName);
于 2012-07-03T05:01:52.687 回答