这是我要解析的 HTML 源代码:
<a style='white-space: nowrap;' href='/AuthorStories-4931/dreamfall.htm'><img class='donoricon' alt='(Current Donor)' title='(Current Donor)' src='http://static.tthf.me/images/donors/Current%20Donor.gif'/>dreamfall</a>
这是我正在使用的代码:
authorLink = doc.DocumentNode.SelectSingleNode("//a[contains(@href, 'AuthorStories')]").OuterHtml;
这会正确抓取链接,但它也会捕获 img。我想抓住的唯一部分是 href 段。关于如何解析那个特定部分的任何建议?