0

这是我要解析的 HTML 源代码:

<a style='white-space: nowrap;' href='/AuthorStories-4931/dreamfall.htm'><img class='donoricon' alt='(Current Donor)'  title='(Current Donor)' src='http://static.tthf.me/images/donors/Current%20Donor.gif'/>dreamfall</a>

这是我正在使用的代码:

authorLink = doc.DocumentNode.SelectSingleNode("//a[contains(@href, 'AuthorStories')]").OuterHtml;

这会正确抓取链接,但它也会捕获 img。我想抓住的唯一部分是 href 段。关于如何解析那个特定部分的任何建议?

4

1 回答 1

1

【好几年没碰HtmlAgilityPack了,不过应该大体上是这样的】

取而代之的是,在返回的节点上OuterHtml应该有一个数组,你应该可以从那里得到。AttributesSelectSingleNodehref

于 2012-10-20T09:49:08.347 回答