我有很多这样的链接:
<a href="/edit_flat/1674093.html"><b>Edit issue >></b></a>
尝试提取 href' 内容我使用 Xpath 表达式:
//a[contains(@href,'/edit_flat')]
但它返回我为空。我究竟做错了什么 ?
//a[contains(@href,'/edit_flat')]
选择a
文档树中任何具有href
包含“/edit_flat”字符串的属性的元素。
这些匹配的元素确实有这个非常“href”的属性,但是您使用的 XPath 表达式“只返回”a
元素,如果有的话。
要实际返回匹配元素的属性值,您需要一个额外的步骤,使用/
and @href
。所以你想要的是:
//a[contains(@href,'/edit_flat')]/@href
建议:
您真正想要的可能是选择href
以子字符串“/edit_flat”开头的链接,因此使用起来更安全:
.//a[starts-with(@href,'/edit_flat')]/@href