我正在使用 Java lib ( JSoup ) 从我的程序可以摄取然后处理的网站获取内容。具体来说,我要查找的内容在下面的ontw
div 中:
<div class="ms5">
<div class="header">
<!-- ... -->
</div>
<div class="body">
<div class="ontw">
<!-- What I want is here -->
</div>
</div>
</div>
使用 JSoup,您可以使用 下载页面Document doc = JSoup.connect("http://www.example.com").get()
,然后使用 解析该页面的内容doc.select("Your CSS selector string here.");
。真的就是这么简单。
我试过:
doc.select("ms5 body ontw");
但这不起作用。从上面的 HTML 来看,我的 CSS 选择器字符串应该是什么?提前致谢!