c# - 选择 div 标签内的链接

Question

我想在 div 类中获取一个链接（具体的 URL）。这是我拥有的代码，可以让我获得 div 类中的文本（Some text...）。

foreach (HtmlNode node in doc.DocumentNode.SelectNodes("//div[@class='content']"))
{
    //saves text (node.InnerText) in array          
}

这是来自该站点的 HTML。我想获得www.google.com

<div class="content">
    <p>Some text... 
    <a href="www.google.com">LINK</a> 
    </p>
</div>

score 0 · Accepted Answer

foreach (HtmlNode node in doc.DocumentNode.SelectNodes("//div[@class='novica']/p/a[@href='www.google.com']"))
{
    //saves text (node.InnerText) in array          
}

score 0 · Accepted Answer

根据您的写作，该代码无效，但是您有 2 个选项：

一旦你有了div, use.GetElementsByTagName("a")或 children 的节点来拉出链接，然后得到它的 href 属性。
修改您的SelectNodes()XPath 以获取a标签：//div[@class='novica']/p/a.

如果您确实需要该.InnerText元素来获取，第一个显然更好Some text...，但是第二个会更快。

score 0 · Accepted Answer

foreach (var node in doc.DocumentNode.SelectNodes("//div[@class='novica']"))
{
    var links = node.Descendants("a").Select(n => n.InnerText).ToList();
}

c# - 选择 div 标签内的链接

3 回答 3

Related

Reference