我正在构建一个网络爬虫。读完这篇我明白 DNS 解析很慢,所以我们应该分离出 DNS Resolver。
所以说你有 String urlString http://google.com 你可以通过这样做将它转换成一个 ip
URL url = new URL(urlString)
InetAddress ip = InetAddress.getByName(url.getHost());
但是,您如何下载实际的网站本身呢?
使用 url,我们可以像这样:
String htmlDocumentString = new Scanner(new url.openStream(), "UTF-8").useDelimiter("\\A").next();
但是如果我们要使用解析后的IP,是不是必须手动重构带有ip的URL呢?没有url.setHost()
办法,就是有点乱?