iso-8859是否支持拉丁字符我需要在java程序中使用iso-8859-1来读取中文文件,这有什么区别
问问题
7023 次
2 回答
13
ISO-8859 是 8 位字符编码的标准。8 位为您提供 256 种组合,这对于拉丁字母的大多数扩展都可以,但对于中文字符则不行。
ISO-8859-1 是支持大多数西欧语言(法语、德语、西班牙语……)的 ISO-8859 的“版本”之一。对于中欧语言(波兰语、捷克语、斯洛伐克语...),您需要 ISO-8859-2 等。
ISO-8859-1 和 ISO-8859-2 之间的不同点之一是 ISO-8859-1 中的法语字母è
,它与 ISO-8859-2 中的捷克/斯洛伐克字母处于相同位置č
。这就是为什么你不能将这两个字母组合成一个文本的原因。
现在使用 Unicode 也可以组合汉字。
于 2011-01-17T09:14:14.817 回答
0
有几种可用于中文的编码(例如简体和繁体)。有关列表,请参见
http://download.oracle.com/javase/6/docs/technotes/guides/intl/encoding.doc.html。最常见的是GB2312
简体EUC_CN
中文和Big5
繁体中文。我还看到了UTF-8
.
于 2011-01-17T10:19:04.110 回答