我正在制定一个打包字典的例程,所以我需要搜索常见的字母组合并将它们替换为仅 1 个字符。
我已经用完了所有“普通”ASCII(<128)字符,但现在我想知道我是否也可以使用 128-255 范围。
或者这些字符是否使用超过 1 个字节?我记得 UTF-8 有时使用 2 或 3 个字节来表示特殊字符。我所有的 javascript 文件都使用 UTF-8 编码。
所以问题是,ü、å、ê 是否使用与 u、a 或 e 相同数量的内存/磁盘空间?
我正在制定一个打包字典的例程,所以我需要搜索常见的字母组合并将它们替换为仅 1 个字符。
我已经用完了所有“普通”ASCII(<128)字符,但现在我想知道我是否也可以使用 128-255 范围。
或者这些字符是否使用超过 1 个字节?我记得 UTF-8 有时使用 2 或 3 个字节来表示特殊字符。我所有的 javascript 文件都使用 UTF-8 编码。
所以问题是,ü、å、ê 是否使用与 u、a 或 e 相同数量的内存/磁盘空间?