4

什么类型的内容会导致此异常?

Caused by: java.io.UnsupportedEncodingException: cp932
        at sun.nio.cs.StreamDecoder.forInputStreamReader(StreamDecoder.java:71)
        at java.io.InputStreamReader.<init>(InputStreamReader.java:100)
        at com.google.code.com.sun.mail.handlers.text_plain.getContent(text_plain.java:109)
        at com.google.code.javax.activation.DataSourceDataContentHandler.getContent(DataHandler.java:803)
        at com.google.code.javax.activation.DataHandler.getContent(DataHandler.java:550)
        at com.google.code.javax.mail.internet.MimeBodyPart.getContent(MimeBodyPart.java:639)

为什么 OpenJDK 不能处理这种编码?

4

1 回答 1

8

使用该字符集/编码的任何文本或基于文本的内容!

根据Wikipedia,CP932 是 Shift JIS ... 的扩展,它是用于表示日语文本的字符集之一。


根据此页面,CP932 位于“扩展编码集(包含在 lib/charsets.jar 中)”中。如果它不在您的 OpenJDK 安装中,请查找 yum / apt / 提供额外 Java 字符集支持的任何 OpenJDK 包。OpenJDK中对 CP932 的支持肯定在某处可用...

OpenJDK 也有可能(尽管 IMO 不太可能)不将“cp932”识别为它所指的“MS932”和“windows-31j”的别名。


我检查了代码

问题是 Java(不仅仅是 OpenJDK!)根本不识别“cp932”别名。它无法识别的原因是别名是non-standard

这种编码的官方(IANA 认可)名称是“windows-31j”,Java 还默认支持以下别名:

  • “MS932”
  • “windows-932”
  • “csWindows31J”

如果将“sun.nio.cs.map”系统属性(即使用“-D...”)设置为“Windows-31J/Shift_JIS”,那么Java也将识别“shift-jis”、“ms_kanji”、 "x-sjis" 和 "csShiftJIS" 是等价的……但这只能用于向后兼容未正确实现真正的 SHIFT-JIS 编码的旧(1.4.0 和更早版本)JDK。(此外,这并不能解决您的问题...)

所以,你可以做什么?

  • 拒绝/丢弃无效的内容。(确实如此。)
  • 找出这些内容的来源,并让他们修复不正确的编码名称。
  • 在 Google 代码尝试使用之前截取编码名称,并将非标准名称替换为适当的标准名称。
  • 使用讨厌的反射hackery 将编码别名添加到Oracle 代码用来查找编码的私有数据结构中。(警告:这可能会使您的应用程序变得脆弱,并导致可移植性问题。)
  • 针对 Java SE 提出 RFE,请求一种简单的方法来为字符编码添加别名。(这是一个非常长期的解决方案,尽管您可以通过编写提议的增强功能并将其作为补丁提交给 OpenJDK 团队来加速它。)
于 2013-08-15T02:15:04.647 回答