我想用 Jsoup 获取网页的所有超链接。同时,我想忽略所有图像的超链接。是否可以为 getElementsByTag 添加更多限制?
Document doc = Jsoup.connect(url).timeout(1000).get();
links = doc.getElementsByTag("a").not("[src]");
我想用 Jsoup 获取网页的所有超链接。同时,我想忽略所有图像的超链接。是否可以为 getElementsByTag 添加更多限制?
Document doc = Jsoup.connect(url).timeout(1000).get();
links = doc.getElementsByTag("a").not("[src]");
如果您的图像使用-attribute与a
标签链接(而普通链接使用),请使用:src
href
Document doc = Jsoup.connect(url).timeout(1000).get();
Elements links = doc.select("a[href]"); // Only select 'a'-tags with 'href' attribute
有关 jsoup 选择器 api,请参见此处。