3

如何从使用 JSOUP 的 html 字符串中获取图标路径?

我发现在网页上添加网站图标的不同方式 -

(在谷歌中)

我可以使用的第一种方法 doc.select("html head meta")

但我不能选择链接标签

4

3 回答 3

4

获取 head 元素上的文件名:

Connection con2=Jsoup.connect(url);
Document doc = con2.get();
Element e=doc.head().select("link[href~=.*\\.ico]").first();
String url=e.attr("href");

http://jsoup.org/cookbook/extracting-data/attributes-text-html

http://jsoup.org/cookbook/extracting-data/selector-syntax

于 2013-07-11T14:40:20.883 回答
3

正如 Uwe Plonus 在评论中指出的那样,您总是可以从<website>/favicon.ico

谷歌网站图标

于 2013-07-11T14:42:55.797 回答
3

提交答案已经很晚了,但正确的检查方法是“rel”标签

 public boolean checkFevicon() {
        Elements e = doc.head().select("link[rel=shortcut icon]");
        if (e.isEmpty()) {
            return false;
        } else {
            return true;
        }
    }

等效的 jQuery

  $("link[rel='shortcut icon']")
于 2015-04-13T12:54:53.047 回答