1

我正在尝试从具有如下多行的网页中提取 href 链接,但我只想要具有<b>块的那些的 a href

<tr bgcolor="#ffffff">
 <td>
  <a href="?6384593.html" style="background-color: transparent;">
  <span class="ts">
    <font size="1">
     <font color="#006633">
     </font>
    </font>
    <b>Lee Swanson Research Update</b>
    <font color="#7777CC"> - Swanson Health Products</font></span>
    </a>
 </td>
</tr>

在这种情况下,我使用 xpath 表达式“//b”来查找粗体标记,但我特别想要的是 a href 链接。xpath可以做到这一点吗?

4

2 回答 2

2
//b/ancestor::a[1]/@href

尝试类似上面的东西

于 2013-10-03T20:14:57.927 回答
2

下面的XPATH将起作用:

//a[.//*[local-name(.)='b']]/@href

按照@Jens Erat 的建议进行更新。

//a[.//b]/@href
于 2013-10-03T20:33:18.030 回答