我必须解析一些 html 并删除锚标签,但我需要保留锚标签的 innerHTML
例如,如果我的 html 文本是:
String html = "<div> <p> some text <a href="#"> some link text </a> </p> </div>"
现在我可以解析上面的 html 并像这样在 jsoup 中选择一个标签,
Document doc = Jsoup.parse(inputHtml);
//this would give me all elements which have anchor tag
Elements elements = doc.select("a");
我可以删除所有这些,
element.remove()
但它会删除从开始括号到结束括号的完整 achor 标签,并且内部 html 会丢失,如何保留仅删除开始和结束标签的内部 HTML。
另外,请注意:我知道有一些方法可以从元素中获取 outerHTML() 和 innerHTML(),但这些方法只提供了检索文本的方法,remove() 方法删除了标记的完整 html。有什么方法可以只删除外部标签并保留 innerHTML 吗?
非常感谢您的帮助。
——拉杰什