0

我决定为自己编写一个小脚本作为 Unicode 参考,因为我最喜欢的在线 Unicode 查找网站已经变得漏洞百出并且充满了广告。到目前为止,这是一个令人愉快的项目。但是,我注意到某些字符显示不正确。

例如,代码点 Ux8E 应该是一个名为“SINGLE SHIFT TWO”的控制字符 - 实际上这是显示的名称,但字符本身显示为 Ž - 这应该是 Ux17D 中的字符,“LATIN CAPITAL LETTER Z与卡隆”。它也是 x8E 中的 CP1252 字符,因此这一定是混淆根源的线索。

为什么我的浏览器会生成并显示 CP1252 编码的字符,我该如何阻止它?目前,该脚本在我的 Mac 上本地运行 - 它是 HTML 5 中的 JavaScript,主要是 jQuery:字符本身表示为,例如“&x8e;” 并使用 jQuery append() 插入。脚本本身以 UTF-8 编码,HTML 在 meta 中指定 UTF-8。是 Apache 的问题吗?操作系统问题?我没有进行广泛的浏览器测试,但在 Safari、Firefox、Opera 和 Chrome 中都是一样的,所以我想不是这样。

我可以简单地删除所有控制字符,因为它们无论如何都不会显示。我目前正在将字符名称从包含所有 Unicode 字符信息的 XML 文件中添加到页面中,因此当我这样做时,我可以检查字符是否是控制字符并相应地删除它。但是 XML 很大,而且 Ajax 的速度很慢,以至于作为快速参考会让人感到困惑,所以我真的很想找到一种方法,让我的计算机一开始就不要向我显示垃圾。

有任何想法吗?

4

1 回答 1

0
于 2015-12-16T01:07:29.887 回答