sql-server - SQL Server 中如何选择聚集索引？

Question

通常聚集索引是通过设置主键在 SQL Server Management Studio 中创建的，但是我最近关于 PK <-> 聚集索引的问题（Microsoft SQL Server 2008 的主键含义）表明没有必要设置 PK 和聚集索引相等。

那么我们应该如何选择聚集索引呢？让我们举个例子：

create table Customers (ID int, ...)
create table Orders (ID int, CustomerID int)

我们通常会在两个 ID 列上创建 PK/CI，但我考虑为 CustomerID 中的订单创建它。那是最好的选择吗？

score 13 · Accepted Answer

根据索引女王金伯利·特里普（Kimberly Tripp）的说法，她在聚集索引中寻找的主要是：

如果您还可以保证：

那么您就非常接近拥有理想的集群密钥了！

在这里查看她的整篇博文，以及关于集群对表操作的关键影响的另一篇非常有趣的博文：集群索引辩论继续。

像 INT（尤其是 INT IDENTITY）或可能是 INT 和 DATETIME 之类的任何东西都是理想的候选人。由于其他原因，GUID 根本不是很好的候选者——所以你可能有一个 GUID 作为你的 PK，但不要将你的表聚集在它上面——它会被碎片化得面目全非，性能也会受到影响。

score 6 · Accepted Answer

索引的最佳候选者CLUSTERED是您最常用于引用记录的键。

通常，这是 a PRIMARY KEY，因为它用于搜索和/或FOREIGN KEY关系。

在您的情况下，Orders.ID很可能会参与搜索和引用，因此它是作为聚类表达式的最佳候选者。

如果在CLUSTERED上创建索引Orders.CustomerID，会发生以下情况：

这个额外的操作需要IndexDepth尽可能多的页面读取Clustered Seek，即表中IndexDepth记录O(log(n))的总数。

score 1 · Accepted Answer

如果您担心聚类，通常是为了帮助改进数据检索。在您的示例中，您可能希望一次获得给定客户的所有记录。在 customerID 上进行聚类将使这些行保持在同一个物理页面上，而不是分散在文件中的多个页面中。

ROT：在您要显示的集合上进行聚类。采购订单中的行项目就是典型的例子。

3 回答 3