0
...<b><a>hello</a></b>...

我想<b></b>从 html 文档中删除标签。可以使用 Jsoup 吗?

4

2 回答 2

0
public String clean(String unsafe){ 
        Whitelist whitelist = Whitelist.none(); 
        whitelist.addTags(new String[]{"a"}); 

        String safe = Jsoup.clean(unsafe, whitelist); 
        return StringEscapeUtils.unescapeXml(safe); 
 } 

Java 中的 String 中删除 Html 标记,除了少数特定的标记

于 2012-08-10T17:02:19.750 回答
0

如果doc您的文档包含您的 HTML:

doc.select("b").unwrap();

(也可以与Element/一起使用Elements

例子:

Document document = new Document("");
document.html("...<b><a>hello</a></b>...").select("b").unwrap();

现在您的文档不包含任何 b-Tag

于 2012-08-24T16:46:51.967 回答