0

我正在尝试从 href 中提取链接。<a class="p_l" href="" id="0" target="_blank"> 这是在页面视图源中可见的内容,但是当我使用 firebug 检查时,href 将包含http://home.website.com/preview/preview?uname=3eadsf132sdas. 我尝试使用 htmlagilitypack 但 href 返回 null。如何提取href中的链接。

4

2 回答 2

1

如果您还没有尝试过这种方式,请尝试这种方式

    HtmlAgilityPack.HtmlDocument htmlDoc = new HtmlAgilityPack.HtmlDocument();

        htmlDoc.OptionFixNestedTags=true;

        htmlDoc.Load(filePath);

 foreach(HtmlNode link in htmlDoc.DocumentElement.SelectNodes("//a[@href"])
 {
    if(link != null)
    {
      if(link["href"] != null)
      {
       HtmlAttribute att = link["href"];
       var url = att.Value;
      }
    }
于 2012-08-13T11:01:54.807 回答
1

您可以尝试不同的方法,例如使用 WebRequest 类获取 html 内容(参见此处如何)。

如果 href 不包含任何链接,则可能意味着它正在使用 Javascript 或其他一些编程语言填充以添加动态内容。如果您可以访问脚本,那么您可能有很小的机会获得链接,但不要这么认为。

于 2012-08-13T13:36:35.300 回答