-1

我对如何请求 http 站点并离线浏览它们进行了一些研究;我发现这是一个可能的答案:

http://www.javaworld.com/jw-05-2000/jw-0518-offload.html

但问题是,它不是那么完整或直观。有没有人有我可以使用的关于这个主题的一个很好的文献资源?

提前致谢

4

2 回答 2

2

使用JsoupJava HTML 解析器

jsoup 是一个用于处理真实世界 HTML 的 Java 库。它提供了一个非常方便的 API 用于提取和操作数据,使用最好的 DOM、CSS 和类似 jquery 的方法。

阅读内容就这么简单:

Document doc = Jsoup.connect("http://en.wikipedia.org/").get();
Elements newsHeadlines = doc.select("#mp-itn b a");
于 2013-07-03T17:06:07.503 回答
1

使用 Jsoup:

Document doc = Jsoup.connect("http://en.wikipedia.org/").get();
Strin html=doc.html();
//save html in a file
于 2013-07-03T17:06:41.490 回答