3

我的应用程序应该解析 html 并将内容加载到列表框中。我可以通过 webclient 获取 html,但无法解析它。
我听说过 Htmlagilitypack 和 Fizzler,但找不到任何关于它们用法的教程或示例。

我需要一些帮助来从下面显示的 html 文档中将“first_content”和“second_content”抓取到列表框中。

<html>
<body> 
<div>
<section>
<article>
   <header> 
       <hgroup> 
           <h1> 
              first_content
           </h1>
       </hgroup>
   </header> 
   <ul> 
        <li> 
           second_content
        </li>
   </ul>
</article> 
</section>
</div>
</body>
</html>
4

2 回答 2

3

HtmlAgilityPack 是要走的路,我一直在 WCF、Windows Phone 和现在的 WinRt 中使用它并取得了圆满成功,有关教程请查看此博客文章

于 2013-02-07T22:17:26.610 回答
0

您可以使用 XPath。例如 ...

var html = "<html><body><div><section><article><header><hgroup><h1>first_content</h1></hgroup></header><ul><li>second_content</li></ul></article> </section></div></body></html>";
var doc = new XmlDocument();
doc.LoadXml(html);
var txt1 = doc.SelectSingleNode("/html/body/div/section/article/header/hgroup/h1").InnerText;
var txt2 = doc.SelectSingleNode("/html/body/div/section/article/ul/li").InnerText;
于 2013-02-11T20:11:56.827 回答