7

我正在尝试使用 jsoup 从该网页中提取所有图片网址?任何人都可以提供有关如何做到这一点的帮助吗?所有标签的格式都是这样的,但我只需要 src 图像,不需要 ajaxsrc:

<IMG ajaxsrc="/pics32/160/MP/MPYXBXTSYVKAKJQ.20110918032436.jpg" src="http://image.cdnllnwnl.xosnetwork.com/pics32/160/MP/MPYXBXTSYVKAKJQ.20110918032436.jpg">

这是链接: http ://www.ncataggies.com/PhotoAlbum.dbml?DB_OEM_ID=24500&PALBID=417884

这是格式吗?

        Document doc = null;
    try {
        doc = Jsoup.connect(articleLink).timeout(10000).get(); 
    } catch (IOException ioe) {
        return null;
    }
    Element content = doc.getElementById("div.thumb-image preview");
    Elements links = content.getElementsByAttribute("IMG");
    for (Element link : links) {
      String source = link.attr("src");
      Elements imageLinks = link.getElementsByAttribute(source);
      for(Element imageLink: imageLinks){
          //imageLink = picture link?
      }

}

好像不是这样。我的代码中有打印语句,它们没有受到影响。

4

3 回答 3

16

您应该能够执行以下操作来获取所有 img 标签:

for (Element e : doc.select("img")) {
    System.out.println(e.attr("src"));
}

这应该选择所有 img 标签,然后获取 src 属性并打印到控制台。

于 2012-05-07T12:39:39.620 回答
1

假设你已经有了这个 IMG 的元素,试试这个:

字符串源 = img.attr("src");

这个 attr 方法继承自 Node 类

高温高压

于 2012-05-04T23:43:03.507 回答
0
Document document = Jsoup.connect(" http://www.ncataggies.com/PhotoAlbum.dbml?DB_OEM_ID=24500&PALBID=417884").get();

        Elements elements =document.getElementsByTag("IMG");
        for(int i=0;i<elements.size();i++)
        {
            System.out.println("Sources of "+ i +":"+elements.get(i).attr("src"));
        }
于 2012-09-10T13:13:31.060 回答