xpath - Groovy htmlunit getByXPath

Question

我目前正在使用 HtmlUnit 尝试从页面中获取 href 并且遇到了一些麻烦。

XPath 是：

/html/body/div[2]/div/div/table/tbody/tr/td[2]/div/div[5]/div/div[2]/span/a

在网页上它看起来像：

<a class="t" title="This Brush" href=http://domain.com/this/that">Brush Set</a>

在我的代码中，我正在做：

hrefs = page.getByXPath("//html/body/div[2]/div/div/table/tbody/tr/td[2]/div/div[5]/div/div[2]/span/a[@class='t']")

但是，这将返回其中的所有内容，而不仅仅是我想要的 url。

有人可以解释我必须添加什么才能获得href吗？（也不以 .html 结尾）

score 5 · Accepted Answer

您正在选择a. 您要选择a/@href.

hrefs = page.getByXPath("//html/body/div[2]/div/div/table/tbody/tr/td[2]/div/div[5]/div/div[2]/span/a[@class='t']/@href")

1 回答 1