database-performance - SQL Server：为什么不区分大小写的列上的 SELECT 比区分大小写的列更快？

Question

我使用 SQL Server 2016 Express 和带有 JDBC 驱动程序版本 4.2 的 Java 应用程序。

我的数据库有一个排序规则Latin1_General_CI_AS（不区分大小写）。我的表有一列 type VARCHAR(128) NOT NULL。该列上有一个唯一索引。

我的测试场景如下：

在插入 150000 个 48 个字符长度的字符串后，我会随机选择 200 个现有字符串。我测量所有查询的总执行时间。

然后我删除索引，更改表以将列排序规则更改为Latin1_General_CS_AS（区分大小写）并再次创建唯一索引。

然后 200 次选择总共需要更多时间。

在这两种情况下（CI 和 CS），执行计划都是简单且相同的（使用索引搜索）。

查询执行时间不仅取决于区分大小写。如果字符串具有相同的前缀，则排序规则 CS 会增长得更快。这是我的结果（以秒为单位的执行时间）：

+----+---------+------------------+-------------------+-------------------+
|    + RND(48) + CONST(3)+RND(45) + CONST(10)+RND(38) + CONST(20)+RND(28) +
+----+---------+------------------+-------------------+-------------------+
| CI +       6 +                6 +                 7 +                 9 +
| CS +      10 +               20 +                45 +                78 +
+----+---------+------------------+-------------------+-------------------+

随机字符串的相同前缀越长，区分大小写的查询花费的时间就越多。

为什么在不区分大小写的列上的搜索比在区分大小写的列上更快？
相同前缀行为的原因是什么？

score 0 · Accepted Answer

原因是您的 SQL 安装（我猜）是使用 CI 排序完成的。这意味着您的 tempdb 和 master 数据库正在使用 CI，目前您自己的数据库也是如此。因此，即使您将字符列更改为 CS，当它在 tempdb 中用于排序/合并操作时，也会在 CI 上下文中执行。要获得准确的比较，您需要将安装排序规则更改为 CS 或在不同的 SQL 实例上并排进行这些比较 - 一个使用 CS，一个使用 CI。

database-performance - SQL Server：为什么不区分大小写的列上的 SELECT 比区分大小写的列更快？

1 回答 1

Related

Reference