我对如何请求 http 站点并离线浏览它们进行了一些研究;我发现这是一个可能的答案:
http://www.javaworld.com/jw-05-2000/jw-0518-offload.html
但问题是,它不是那么完整或直观。有没有人有我可以使用的关于这个主题的一个很好的文献资源?
提前致谢
我对如何请求 http 站点并离线浏览它们进行了一些研究;我发现这是一个可能的答案:
http://www.javaworld.com/jw-05-2000/jw-0518-offload.html
但问题是,它不是那么完整或直观。有没有人有我可以使用的关于这个主题的一个很好的文献资源?
提前致谢
使用Jsoup:Java HTML 解析器
jsoup 是一个用于处理真实世界 HTML 的 Java 库。它提供了一个非常方便的 API 用于提取和操作数据,使用最好的 DOM、CSS 和类似 jquery 的方法。
阅读内容就这么简单:
Document doc = Jsoup.connect("http://en.wikipedia.org/").get();
Elements newsHeadlines = doc.select("#mp-itn b a");
使用 Jsoup:
Document doc = Jsoup.connect("http://en.wikipedia.org/").get();
Strin html=doc.html();
//save html in a file