0

我正在制定一个打包字典的例程,所以我需要搜索常见的字母组合并将它们替换为仅 1 个字符。

我已经用完了所有“普通”ASCII(<128)字符,但现在我想知道我是否也可以使用 128-255 范围。

或者这些字符是否使用超过 1 个字节?我记得 UTF-8 有时使用 2 或 3 个字节来表示特殊字符。我所有的 javascript 文件都使用 UTF-8 编码。

所以问题是,ü、å、ê 是否使用与 u、a 或 e 相同数量的内存/磁盘空间?

4

1 回答 1

0

JavaScript 在内部使用 UTF-16 或 UCS-2。给定字符的内存量取决于特定 JavaScript 引擎实现中字符串的处理方式。可以肯定地说,每个字符至少使用 2 个字节。对于您列出的字符,每个字符将使用相同的 2 个字节。

参考: http: //mathiasbynens.be/notes/javascript-encoding

于 2013-11-13T17:33:09.020 回答