如果您是 Java 新手,您可能希望利用现有库使事情变得更容易一些。 Jsoup允许您使用 CSS 样式的选择器获取 HTML 页面并提取元素。
这只是一个快速且非常肮脏的示例,但我认为它将展示 Jsoup 可以轻松完成这样的任务。请注意,省略了错误处理和响应代码处理,我只是想传递大致的想法:
Document doc = Jsoup.connect("http://stackoverflow.com/questions/14541740/java-program-to-download-images-from-a-website-and-display-the-file-sizes").get();
Elements imgElements = doc.select("img[src]");
Map<String, String> fileSizeMap = new HashMap<String, String>();
for(Element imgElement : imgElements){
String imgUrlString = imgElement.attr("abs:src");
URL imgURL = new URL(imgUrlString);
HttpURLConnection httpConnection = (HttpURLConnection) imgURL.openConnection();
String contentLengthString = httpConnection.getHeaderField("Content-Length");
if(contentLengthString == null)
contentLengthString = "Unknown";
fileSizeMap.put(imgUrlString, contentLengthString);
}
for(Map.Entry<String, String> mapEntry : fileSizeMap.entrySet()){
String imgFileName = mapEntry.getKey();
System.out.println(imgFileName + " ---> " + mapEntry.getValue() + " bytes");
}
您也可以考虑查看Apache HttpClient。我发现它通常比原始的 URLConnection/HttpURLConnection 方法更可取。