我正在尝试从 href 中提取链接。<a class="p_l" href="" id="0" target="_blank">
这是在页面视图源中可见的内容,但是当我使用 firebug 检查时,href 将包含http://home.website.com/preview/preview?uname=3eadsf132sdas
. 我尝试使用 htmlagilitypack 但 href 返回 null。如何提取href中的链接。
问问题
750 次
2 回答
1
如果您还没有尝试过这种方式,请尝试这种方式
HtmlAgilityPack.HtmlDocument htmlDoc = new HtmlAgilityPack.HtmlDocument();
htmlDoc.OptionFixNestedTags=true;
htmlDoc.Load(filePath);
foreach(HtmlNode link in htmlDoc.DocumentElement.SelectNodes("//a[@href"])
{
if(link != null)
{
if(link["href"] != null)
{
HtmlAttribute att = link["href"];
var url = att.Value;
}
}
于 2012-08-13T11:01:54.807 回答
1
您可以尝试不同的方法,例如使用 WebRequest 类获取 html 内容(参见此处如何)。
如果 href 不包含任何链接,则可能意味着它正在使用 Javascript 或其他一些编程语言填充以添加动态内容。如果您可以访问脚本,那么您可能有很小的机会获得链接,但不要这么认为。
于 2012-08-13T13:36:35.300 回答