1

我有一个文档,我试图从中提取 a 标签。其中一些位于具有 class 属性的 div 标记中,并且该类具有 display:none 属性集。它们不会直接使用 div 标签中的 style 属性隐藏。我想消除那些。css 使用链接标签包含在页面中。

4

1 回答 1

0

Select all <a>-tags and search if one of the parents is a <div> with the hiding-class:

for (Element a : doc.getElementsByTag("a")) {
    for (Element parent : a.parents()) {
        if (parent.tagName().equals("div") && parent.hasClass("hidden")) {
            a.remove();
        }
    }
}

Or easier - just remove all anchors in a <div> with the hiding-class:

doc.select("div.hidden a").remove();
于 2013-09-08T08:01:16.037 回答