1

我必须从给定的代码中提取 a href 值

<table>
<tr>
<td class="left ">
<a href="reference" >Refer</a>see this
<sup class="super"><a href=​"#src1" onclick=​"dosomething;​" title=​"1" >​1​&lt;/a>​&lt;/sup>
</td>
<td class="td_right2" style="padding-top: .25em"></td>
</tr>
..

</table>

我的代码是

 for(Element info: div3.select("tr")){
 Elements aqInfo= companyB.select("td") 
 String href=aqInfo.text(); 
 }

href 只给我标签内的文本以外的文本

如何获取 sup 标签内的 text 和 href 标签?

编辑:我意识到页面源看起来像这样

<tr><td class="left "><a href="reference" ">Reference</a>see this <sup class="super_src"></sup></td><td class="right" style="padding-top: .25em"></td></tr>

Firefox 中的“检查元素”显示了<a>内部<sup>,我需要 this 的内容<a>。如果我错了,请纠正我,但我认为这Jsoup.connect(url).get();给出了源文档,而 Inspect 元素给出了当前加载的页面。有没有办法在页面完全加载后检索页面?

4

1 回答 1

0

试试这个:

Element mySup= doc.select("sup.super").first();
String linkHref = mySup.child(0).attr("href");
String linkVal = mySup.child(0).text();

解释:

选择带有sup标签和super类的元素访问它的第一个子a标签,然后访问它的href属性

得到你应该做hreftext inside the a一切a

Elements links = doc.select("a[href]");
for (Element link : links) {
  String linkHref = link.attr("href");
  String linkText = link.text();
}
于 2012-06-20T09:05:45.463 回答