0

据我了解,字符编码将位映射到整数,而字符集将整数映射到字符。

所以在 Unicode 字符集中有一个电话字符。它使用整数 9742 表示,更常用的十六进制表示为 260E。然后使用 UTF-8 将其保存到一个文件中,它将整数 9742 转换为 10011000001110。如果我错了,请纠正我。

昨天我创建了一个使用 Unicode 字符集和 UTF-8 编码的文本文件,并将它保存到我的桌面。然后我在我的文本编辑器中重新打开了该文件,并开始手动切换字符集以获得乐趣。不出所料,开始显示问题和奇怪的字符!我注意到只有一些字符被歪曲了。这让我想到,为什么只有一些角色会崩溃?为什么不是全部?

有人告诉我,中断的字符是原始 ASCII 规范之外的字符。经过反思,这似乎是有道理的,因为只有非美国字符会中断。有人告诉我,因为所有字符集都使用前 128 个字符的 ASCII 字符集,所以它们将保持不中断,而中断的是 127 以上的字符。如果我错了,请纠正我。

终于,我开始思考了。是否有任何不尊重 ASCII 的字符集?如果是这样,它们叫什么,它们是做什么用的?

4

1 回答 1

0

根据我从评论中得到的发现,我能够回答我自己的问题。感谢所有评论的人!

是的,有一对;EBCDICBaudot

于 2017-03-28T10:15:19.033 回答