0

我正在尝试使用 jsoup 抓取网站的数据。但是在获取一些文本时遇到了一些问题。

部分 html 看起来像这样

<p class="time">9:00</p>

我可以使用代码行很好地抓住它:

Document doc = Jsoup.connect(url).get();
doc.select("p.time").text());

但下一点 html 看起来像这样:

<p class="date"><strong>FRIDAY 27<sup>th</sup></strong> JULY 2012</p>

我不知道如何得到。使用该行:

doc.select("p.date").text());

只是给我一个空字符串。我已经尝试过它的变体(即选择“p.date”,然后尝试 date.select("strong")),但只是不断提出一个空字符串。

我该如何获取该日期文本?

4

1 回答 1

1

Unable to reproduce your problem.

Document doc = Jsoup.parse("<html><body><p class=\"date\"><strong>FRIDAY 27<sup>th</sup></strong> JULY 2012</p></body></html>");
String s = doc.select("p.date").text();
System.out.println(s);

This prints: "FRIDAY 27th JULY 2012"

于 2012-07-01T21:08:52.637 回答