我有以下 html 代码,我正在尝试从中提取日期。如何使用 Jsoup 的方法 select() 来做到这一点?
<span class="lead">Written on</span> 05.01.2013 at 12:16 <br />
这里:
final String html = "<span class=\"lead\">Written on</span> 05.01.2013 at 12:16 <br />";
Document doc = Jsoup.parse(html);
for( Element element : doc.select("span.lead") )
{
// Simple output of the date; 'toString()' gives you the value
System.out.println(element.nextSibling().toString());
}
输出:
05.01.2013 at 12:16
解释:
doc.select("span.lead")
您获得span
Html 的 -tag。span
-tag (本例中只有一个)element.nextSibling()
节点之后获得下一个节点span
由于有一个前导空白,您可以使用trim()
它来删除它:element.nextSibling().toString().trim()