0

我们有人在 Java 的字节数组中发送不可打印的 \x86 类型的字符,当我们将其转换为 us-ascii 字符串时,它会在 ascii 文本中插入垃圾字符。

在将数据从 EBCDIC 等格式转换为 Java 中的 ASCII 时,是否有字符串格式/其他方式来处理不可打印的 ascii 字符?

4

2 回答 2

1

你想如何处理它们?将它们替换为可打印的内容(例如“?”)?完全删除它们?其他动作?

于 2012-04-13T18:05:25.417 回答
0

如果您在美国或“西欧”(英国、法国、德国),则字符集可能是Windows-1252。单字节字符集 US-ASCII 涵盖 128 个字符,单字节字符集 Windwos-1252 是一个超集,涵盖了字节范围内的所有 255 个字符。

最简单的是 \u0080 - \u00ff 的转换表。字符串,因为有些可能最好用几个字符代替,比如 \u008c 用“OE”。

于 2012-04-13T18:21:22.340 回答