我需要 JSoup 从一些 HTML 字符串中删除脚本,并为此使用此代码段:
Document unsafeDoc = Jsoup.parse(unsafeHtml);
Document safeDoc = cleaner.clean(unsafeDoc);
OutputSettings o = safeDoc.outputSettings();
o.escapeMode(EscapeMode.xhtml);
return safeDoc.select("body").html();
但是它在<br>
标签之前插入了额外的空格,将“和”转换为"
;'
等等,这是我不想要的。找不到实现这一目标的方法。希望除了 JSoup 之外的任何其他库的帮助或建议。
谢谢,桑杰