1

我正在使用 Java lib ( JSoup ) 从我的程序可以摄取然后处理的网站获取内容。具体来说,我要查找的内容在下面的ontwdiv 中:

<div class="ms5">
    <div class="header">
        <!-- ... -->
    </div>
    <div class="body">
        <div class="ontw">
            <!-- What I want is here -->
        </div>
    </div>
</div>

使用 JSoup,您可以使用 下载页面Document doc = JSoup.connect("http://www.example.com").get(),然后使用 解析该页面的内容doc.select("Your CSS selector string here.");。真的就是这么简单。

我试过:

doc.select("ms5 body ontw");

但这不起作用。从上面的 HTML 来看,我的 CSS 选择器字符串应该是什么?提前致谢!

4

4 回答 4

4

类是用一个点选择的,所以你必须选择.md5 .body .ontw

doc.select(".md5 .body .ontw");
于 2013-10-16T12:32:54.063 回答
1
Element masthead = doc.select("div.ontw").first();// div with class=ontw

您可以参考 JSoup 文档:

http://jsoup.org/cookbook/extracting-data/selector-syntax

于 2013-10-16T12:33:57.847 回答
1
doc.select("div.ontw");

会是我所期望的

于 2013-10-16T12:36:44.457 回答
0
.ms5 .body .ontw

是你想要的。这是一个演示:http ://try.jsoup.org/~jAMCqcMjLMSA5FYJV7Cn3Aah4AE

于 2013-10-16T12:43:43.317 回答