2

我在 PHP 和 MySQL 中将所有排序规则和字符集设置为 UTF8。没有问题。但正如在http://dev.mysql.com/doc/refman/5.5/en/charset-unicode-utf8mb4.html上看到的,标准utf8_general_ci排序规则使用三个字节来存储字符。这应该足以存储所有BMP字符。但是我仍然没有找到任何提示,如果所有韩文和日文字符都包含在 BMP 中,或者是否有字符需要存储四个字节。我只是想知道,是否utf8_general_ci真的utf8_bin足以存储所有韩文/日文字符,或者我是否必须使用utf8mb4_general_ciand utf8mb4_bin

4

1 回答 1

2

最常用的字符在 BMP 中。高等位面中的字符大多是稀有且具有历史意义的,但其中一些可能会被用于个人名称中。如果你可以使用utf8mb4你可能应该。

于 2013-09-10T10:17:21.367 回答