0

我有以下 html 代码,我正在尝试从中提取日期。如何使用 Jsoup 的方法 select() 来做到这一点?

<span class="lead">Written on</span> 05.01.2013 at 12:16 <br /> 
4

1 回答 1

0

这里:

final String html = "<span class=\"lead\">Written on</span> 05.01.2013 at 12:16 <br />";

Document doc = Jsoup.parse(html);

for( Element element : doc.select("span.lead") )
{
    // Simple output of the date; 'toString()' gives you the value
    System.out.println(element.nextSibling().toString());
}

输出:

 05.01.2013 at 12:16 

解释:

  1. 随着doc.select("span.lead")您获得spanHtml 的 -tag。
  2. 您遍历每个span-tag (本例中只有一个)
  3. 随着您在- 您寻找的文本element.nextSibling()节点之后获得下一个节点span

由于有一个前导空白,您可以使用trim()它来删除它:element.nextSibling().toString().trim()

于 2013-01-05T15:32:15.367 回答