我们有人在 Java 的字节数组中发送不可打印的 \x86 类型的字符,当我们将其转换为 us-ascii 字符串时,它会在 ascii 文本中插入垃圾字符。
在将数据从 EBCDIC 等格式转换为 Java 中的 ASCII 时,是否有字符串格式/其他方式来处理不可打印的 ascii 字符?
你想如何处理它们?将它们替换为可打印的内容(例如“?”)?完全删除它们?其他动作?
如果您在美国或“西欧”(英国、法国、德国),则字符集可能是Windows-1252。单字节字符集 US-ASCII 涵盖 128 个字符,单字节字符集 Windwos-1252 是一个超集,涵盖了字节范围内的所有 255 个字符。
最简单的是 \u0080 - \u00ff 的转换表。字符串,因为有些可能最好用几个字符代替,比如 \u008c 用“OE”。