几个星期以来,我一直在努力解决查询性能问题。在这一点上,我已经从 JOIN 类型、索引、保持统计信息等方面完全排除了查询中的所有内容……等等……但后来我偶然发现了一些东西。
一点背景。
有问题的表格代表一个Record
Id INT PK
Name NVARCHAR(50)
Status INT FK
Created DATETIME
Version NVARCHAR(10)
Data XML
在进行了一些性能基准测试之后,我意识到在选择中包含最后一列远远超过了索引、连接复杂性和网络考虑因素等因素 10 倍和 20 倍之间。
以下比较是在连接到 SQL Azure 的本地开发机器上的 SSMS 之间进行的。
SELECT Id FROM Records -- ~10 secs for 300,000 rows
SELECT Id, Name, Status, Created, Version FROM Records -- ~20 sec for 300,000 rows
SELECT * FROM Records -- ~350 sec for 300,000 rows
需要明确的是,我并没有对 xml 列(XML DML 或 XPath 查询)做任何疯狂的事情。只是简单地从选择中包含/排除它。
在这一点上,我想我已经通过创建RecordLight
实体、NHibernate Map 和 MVC 控制器堆栈解决了我的问题,纯粹是为了在我们的应用程序中搜索和列出。
但我想了解为什么包含 XML 列会对查询性能产生如此负面的影响