Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我正在使用 JSoup 清理来自用户的传入文本。唉,它似乎不支持用于清洁的非 ascii 字符:
assertEquals("привет", Jsoup.clean("привет", Whitelist.none()));
这不起作用。
任何想法?
如果您运行代码,默认编码是什么?也许这个不是 UTF-8 而是 linux/windows 默认的。您可以使用 VM 参数-Dfile.encoding=UTF8来确保 UTF-8。
-Dfile.encoding=UTF8
也使用 jsoup 1.6.3 检查了您的代码 --> 测试成功