我们正在使用 Jsoup.clean(String, Whitelist) 来处理一些输入,并且似乎 Jsoup 在可接受的标签之前添加了一个无关的换行符。我看到一些人在互联网上发布了这个问题,但一直无法找到解决方案。
例如,假设我们有一个非常简单的字符串,其中包含一些粗体标签,如下所示:
String htmlToClean = "This is a line with <b>bold text</b> within it."
String returnString = Jsoup.clean(htmlToClean, Whitelist.relaxed());
System.out.println(returnString);
调用 clean() 方法的结果是这样的:
This is a line with \n<b>bold text</b> within it.
请注意,在开始的粗体标记之前附加了无关的“\n”。我似乎无法在附加的源中找到它(尽管我承认我是 Jsoup 的新手)。
有没有人遇到过这个问题,更好的是,已经找到了一些方法来避免这种额外的、不需要的字符以这种方式附加到字符串中?