0

我想使用 C# 在 asp.net 中读取远程网页的内容。我已经使用 asp.net 中的以下代码阅读了它。

 protected void Page_Load(object sender, EventArgs e)
    {
        string TheUrl = "http://www.demosite.com/Default.aspx";
        string response = GetHtmlPage(TheUrl);
        Response.Write(response);

    }
static string GetHtmlPage(string strURL)
    {

        String strResult;
        WebResponse objResponse;
        WebRequest objRequest = HttpWebRequest.Create(strURL);
        objResponse = objRequest.GetResponse();
        using (StreamReader sr = new StreamReader(objResponse.GetResponseStream()))
        {
            strResult = sr.ReadToEnd();
            sr.Close();
        }
        return strResult;
    }

在这里,我得到了远程网页的全部内容,现在我想逐个标签地读取内容标签并只获取它的内容。可能吗?

帮助赞赏...!提前致谢!

4

1 回答 1

0

使用HTML Agility 包遍历元素。这是解析 HTML 的最佳方式。

您应该能够获得所有文本节点

doc.DocumentNode.SelectNodes("//text()[normalize-space(.) != '']")
于 2012-10-09T11:38:43.130 回答