...<b><a>hello</a></b>...
我想<b></b>
从 html 文档中删除标签。可以使用 Jsoup 吗?
...<b><a>hello</a></b>...
我想<b></b>
从 html 文档中删除标签。可以使用 Jsoup 吗?
public String clean(String unsafe){
Whitelist whitelist = Whitelist.none();
whitelist.addTags(new String[]{"a"});
String safe = Jsoup.clean(unsafe, whitelist);
return StringEscapeUtils.unescapeXml(safe);
}
如果doc
您的文档包含您的 HTML:
doc.select("b").unwrap();
(也可以与Element
/一起使用Elements
)
例子:
Document document = new Document("");
document.html("...<b><a>hello</a></b>...").select("b").unwrap();
现在您的文档不包含任何 b-Tag