1

我目前正在使用 HtmlUnit 尝试从页面中获取 href 并且遇到了一些麻烦。

XPath 是:

/html/body/div[2]/div/div/table/tbody/tr/td[2]/div/div[5]/div/div[2]/span/a    

在网页上它看起来像:

<a class="t" title="This Brush" href=http://domain.com/this/that">Brush Set</a>

在我的代码中,我正在做:

hrefs = page.getByXPath("//html/body/div[2]/div/div/table/tbody/tr/td[2]/div/div[5]/div/div[2]/span/a[@class='t']")

但是,这将返回其中的所有内容,而不仅仅是我想要的 url。

有人可以解释我必须添加什么才能获得href吗?(也不以 .html 结尾)

4

1 回答 1

5

您正在选择a. 您要选择a/@href.

hrefs = page.getByXPath("//html/body/div[2]/div/div/table/tbody/tr/td[2]/div/div[5]/div/div[2]/span/a[@class='t']/@href")
于 2010-11-25T00:55:17.017 回答