鉴于您选择所有列的规范,此时几乎没有区别 。然而,要意识到数据库模式确实发生了变化。如果您使用SELECT *
,您将获得添加到表中的任何新列,即使您的代码很可能不准备使用或呈现该新数据。这意味着您将系统暴露在意外的性能和功能更改中。
您可能愿意将此视为一笔不小的成本,但要意识到您仍然不需要的列必须是:
- 从数据库中读取
- 通过网络发送
- 编组到您的流程中
- (对于 ADO 类型的技术)保存在内存中的数据表中
- 忽略和丢弃/垃圾收集
第 1 项有许多隐藏的成本,包括消除一些潜在的覆盖索引、导致数据页面加载(和服务器缓存抖动)、产生本来可以避免的行/页面/表锁定。
将此与指定列与指定列的潜在节省进行平衡*
,唯一可能的节省是:
- 程序员不需要重新访问 SQL 来添加列
- SQL 的网络传输更小/更快
- SQL Server 查询解析/验证时间
- SQL Server 查询计划缓存
对于第 1 项,现实情况是您将添加/更改代码以使用您可能添加的任何新列,因此这是一个清洗。
对于第 2 项,差异很少足以将您推入不同的数据包大小或网络数据包数量。如果您到了 SQL 语句传输时间是主要问题的地步,您可能需要首先降低语句速率。
对于第 3 项,没有任何节省,因为*
无论如何都必须进行扩展,这意味着无论如何都要咨询表模式。实际上,列出列将产生相同的成本,因为它们必须针对架构进行验证。换句话说,这是一次彻底的清洗。
对于第 4 项,当您指定特定列时,您的查询计划缓存可能会变大,但前提是您要处理不同的列集(这不是您指定的)。在这种情况下,您确实需要不同的缓存条目,因为您需要根据需要使用不同的计划。
因此,由于您指定问题的方式,这一切都归结为面对最终模式修改时的问题弹性。如果您将此模式刻录到 ROM 中(它发生了),那么 an*
是完全可以接受的。
但是,我的一般准则是您应该只选择您需要的列,这意味着有时看起来您要求所有列,但 DBA 和模式演变意味着可能会出现一些新列,这可能会极大地影响查询.
我的建议是您应该始终选择特定的列。请记住,您一遍又一遍地擅长做的事情,所以要养成正确做事的习惯。
如果您想知道为什么架构可能会在不更改代码的情况下更改,请考虑审计日志、生效/到期日期以及 DBA 为系统性地解决合规性问题而添加的其他类似内容。另一个不正当更改的来源是系统或用户定义字段中其他地方的性能的非规范化。