5

iso-8859是否支持拉丁字符我需要在java程序中使用iso-8859-1来读取中文文件,这有什么区别

4

2 回答 2

13

ISO-8859 是 8 位字符编码的标准。8 位为您提供 256 种组合,这对于拉丁字母的大多数扩展都可以,但对于中文字符则不行。

ISO-8859-1 是支持大多数西欧语言(法语、德语、西班牙语……)的 ISO-8859 的“版本”之一。对于中欧语言(波兰语、捷克语、斯洛伐克语...),您需要 ISO-8859-2 等。

ISO-8859-1 和 ISO-8859-2 之间的不同点之一是 ISO-8859-1 中的法语字母è,它与 ISO-8859-2 中的捷克/斯洛伐克字母处于相同位置č。这就是为什么你不能将这两个字母组合成一个文本的原因。

现在使用 Unicode 也可以组合汉字。

于 2011-01-17T09:14:14.817 回答
0

有几种可用于中文的编码(例如简体和繁体)。有关列表,请参见 http://download.oracle.com/javase/6/docs/technotes/guides/intl/encoding.doc.html。最常见的是GB2312简体EUC_CN中文和Big5繁体中文。我还看到了UTF-8.

于 2011-01-17T10:19:04.110 回答