-1

我想在 div 类中获取一个链接(具体的 URL)。这是我拥有的代码,可以让我获得 div 类中的文本(Some text...)。

foreach (HtmlNode node in doc.DocumentNode.SelectNodes("//div[@class='content']"))
{
    //saves text (node.InnerText) in array          
}

这是来自该站点的 HTML。我想获得www.google.com

<div class="content">
    <p>Some text... 
    <a href="www.google.com">LINK</a> 
    </p>
</div>
4

3 回答 3

0
foreach (HtmlNode node in doc.DocumentNode.SelectNodes("//div[@class='novica']/p/a[@href='www.google.com']"))
{
    //saves text (node.InnerText) in array          
}
于 2012-12-31T11:58:08.387 回答
0

根据您的写作,该代码无效,但是您有 2 个选项:

  1. 一旦你有了div, use.GetElementsByTagName("a")或 children 的节点来拉出链接,然后得到它的 href 属性。

  2. 修改您的SelectNodes()XPath 以获取a标签://div[@class='novica']/p/a.

如果您确实需要该.InnerText元素来获取,第一个显然更好Some text...,但是第二个会更快。

于 2012-12-31T12:00:08.537 回答
0
foreach (var node in doc.DocumentNode.SelectNodes("//div[@class='novica']"))
{
    var links = node.Descendants("a").Select(n => n.InnerText).ToList();
}
于 2012-12-31T12:00:15.123 回答