我使用 SQL Server 2016 Express 和带有 JDBC 驱动程序版本 4.2 的 Java 应用程序。
我的数据库有一个排序规则Latin1_General_CI_AS
(不区分大小写)。我的表有一列 type VARCHAR(128) NOT NULL
。该列上有一个唯一索引。
我的测试场景如下:
在插入 150000 个 48 个字符长度的字符串后,我会随机选择 200 个现有字符串。我测量所有查询的总执行时间。
然后我删除索引,更改表以将列排序规则更改为Latin1_General_CS_AS
(区分大小写)并再次创建唯一索引。
然后 200 次选择总共需要更多时间。
在这两种情况下(CI 和 CS),执行计划都是简单且相同的(使用索引搜索)。
查询执行时间不仅取决于区分大小写。如果字符串具有相同的前缀,则排序规则 CS 会增长得更快。这是我的结果(以秒为单位的执行时间):
+----+---------+------------------+-------------------+-------------------+
| + RND(48) + CONST(3)+RND(45) + CONST(10)+RND(38) + CONST(20)+RND(28) +
+----+---------+------------------+-------------------+-------------------+
| CI + 6 + 6 + 7 + 9 +
| CS + 10 + 20 + 45 + 78 +
+----+---------+------------------+-------------------+-------------------+
随机字符串的相同前缀越长,区分大小写的查询花费的时间就越多。
- 为什么在不区分大小写的列上的搜索比在区分大小写的列上更快?
- 相同前缀行为的原因是什么?