0

我正在寻找如何使用Jsoup.

事实上,我曾尝试过以下代码:

Document document = Jsoup.connect("http://edition.cnn.com/2013/11/10/world/asia/philippines-typhoon-haiyan/index.html").get();

Element contents = document.select("#content").first();

System.out.println(contents.html()); 

System.out.println(contents.text()); 

我收到了这个错误:

Exception in thread "main" java.lang.NullPointerException
at com.clearforest.Test.main(Test.java:36)

请问您有什么想法吗?如何从文章中提取正确的文本。

4

1 回答 1

1

调用后您contents Element的为空select-您指定的选择器在从 CNN 下载的文档中不返回任何匹配项-尝试类似document.select("div.cnn_strycntntlft")返回故事 div 内容的方法。

于 2013-11-12T17:27:38.213 回答