0

有没有办法使用 Java 的 JSoup 插件从同名的多个类中获取 HTML?

例如:

<div class="div_idalgo_content_result_date_match_local">
blablabla
</div>

<div class="div_idalgo_content_result_date_match_local">
123456789
</div>

我想在一个字符串中得到 blablabla,在另一个字符串中得到 123456789。

我希望我的问题是可以理解的。

4

1 回答 1

2

这可以通过几种不同的方式来完成。

如果要选择具有上述类名的 div,可以简单地使用以下命令:

    Elements div = doc.select("div.div_idalgo_content_result_date_match_local");

Element这将为您提供可以迭代的集合。如果之后您可能只想选择第一个,您可以使用:eq(0)-parameter 或first()-parameter。

    Element firstDiv = div.first();

或者

    Elements div = doc.select("div.div_idalgo_content_result_date_match_local:eq(0)");

请注意,您是从文档中选择的第二种方法,而在第一种方法中您是从Element's 的集合中选择的。当然,您也可以将 的值更改为:eq(0)与您的元素匹配的其他值。您可以使用许多有用的选择器,我在答案的末尾包含了一个链接。

以下代码会将您的 div 分成两部分:

    Elements div = doc.select("div.div_idalgo_content_result_date_match_local");
    Element firstDiv = div.first();
    Element secondDiv = div.get(1);

    System.out.println("This is the first div: " + firstDiv.text());
    System.out.println("This is the second div: " + secondDiv.text());

JSoup Cookbook - 选择器语法

于 2013-07-24T08:49:43.597 回答