当我在包含大约一亿行的表中查询特定日期的最小 ID 时,我目前在我的数据库中遇到了一个奇怪的行为。查询很简单:
SELECT MIN(Id) FROM Connection WITH(NOLOCK) WHERE DateConnection = '2012-06-26'
这个查询永远不会结束,至少我让它运行了几个小时。DateConnection 列不是索引,也不包含在其中。所以我会理解这个查询可以持续很长时间。但我尝试了以下在几秒钟内运行的查询:
SELECT Id FROM Connection WITH(NOLOCK) WHERE DateConnection = '2012-06-26'
它返回 300k 行。
我的表定义如下:
CREATE TABLE [dbo].[Connection](
[Id] [bigint] IDENTITY(1,1) NOT NULL,
[DateConnection] [datetime] NOT NULL,
[TimeConnection] [time](7) NOT NULL,
[Hour] AS (datepart(hour,[TimeConnection])) PERSISTED NOT NULL,
CONSTRAINT [PK_Connection] PRIMARY KEY CLUSTERED
(
[Hour] ASC,
[Id] ASC
)
)
它具有以下索引:
CREATE UNIQUE NONCLUSTERED INDEX [IX_Connection_Id] ON [dbo].[Connection]
(
[Id] ASC
)ON [PRIMARY]
我发现使用这种奇怪行为的一种解决方案是使用以下代码。但在我看来,这样一个简单的查询有点沉重。
create table #TempId
(
[Id] bigint
)
go
insert into #TempId
select id from partitionned_connection with(nolock) where dateconnection = '2012-06-26'
declare @displayId bigint
select @displayId = min(Id) from #CoIdTest
print @displayId
go
drop table #TempId
go
有没有人遇到过这种行为,它的原因是什么?最小聚合是扫描整个表吗?如果是这种情况,为什么简单的选择不呢?