1

我需要 JSoup 从一些 HTML 字符串中删除脚本,并为此使用此代码段:

Document unsafeDoc = Jsoup.parse(unsafeHtml);
Document safeDoc = cleaner.clean(unsafeDoc);
OutputSettings o = safeDoc.outputSettings();
o.escapeMode(EscapeMode.xhtml);
return safeDoc.select("body").html();

但是它在<br>标签之前插入了额外的空格,将“和”转换为&quot;&apos;等等,这是我不想要的。找不到实现这一目标的方法。希望除了 JSoup 之外的任何其他库的帮助或建议。

谢谢,桑杰

4

1 回答 1

1

尝试使用:

safeDoc.outputSettings().prettyPrint(false);

我有同样的问题,并解决了它。

于 2012-08-16T11:23:27.363 回答