我有
Document document = Jsoup.connect(link).get();
有时对于某些网址,我会遇到异常:
Exception in thread "main" java.nio.charset.UnsupportedCharsetException: X-MAC-ROMAN
at java.nio.charset.Charset.forName(Unknown Source)
at org.jsoup.helper.DataUtil.parseByteData(DataUtil.java:86)
at org.jsoup.helper.HttpConnection$Response.parse(HttpConnection.java:469)
at org.jsoup.helper.HttpConnection.get(HttpConnection.java:147)
我有一个 catch 块:
catch (IOException e1)
我理解例外是因为 java 是 unicode 并且该网页/网站没有遵循 unicode。如何处理这个问题 连接也被用于包括 unicode 和 bytecode 的许多网站