9

我有一个简单的问题 -和UTF-8之间有什么区别?我知道编码的字符串有不同的大小,但是和是什么?不应该能够正确处理所有语言吗?以及如何适应这一点?UTF-16UTF-32UTF-16UTF-32UTF-8UTF-7

编辑

好的,我相对了解整个事情的技术方面,但我仍然看不出我应该使用例如UTF-16而不是UTF-8在我的应用程序中的原因。所以我的问题是 - 那么其他编码的实际用途是什么UTF-8

4

2 回答 2

3

著名的 Joel Spolsky 的这篇文章完美地解释了它:http: //www.joelonsoftware.com/articles/Unicode.html

引用:

有数百种传统编码只能正确存储一些代码点,而将所有其他代码点都变成问号。一些流行的英文文本编码是 Windows-1252(西欧语言的 Windows 9x 标准)和 ISO-8859-1,又名 Latin-1(也适用于任何西欧语言)。但是尝试以这些编码存储俄语或希伯来语字母,你会得到一堆问号。UTF 7、8、16 和 32 都具有能够正确存储任何代码点的优良特性。

于 2012-06-10T17:38:16.837 回答
0

也许Unicode 常见问题解答会有所帮助?

有一个比较图表总结了一些差异。

于 2012-06-10T17:36:16.607 回答