91

假设我必须实现一段 T-SQL 代码,该代码必须返回一个表作为结果。我可以实现一个表值函数或返回一组行的存储过程。我应该使用什么?

简而言之,我想知道的是:

函数和存储过程之间的主要区别是什么?使用其中一种时,我必须考虑哪些因素?

4

12 回答 12

52

如果您可能希望将这段代码的结果与其他表结合起来,那么显然表值函数将允许您在单个 SELECT 语句中组合结果。

通常,有一个层次结构(View < TV Function < Stored Proc)。你可以在每一个中做更多的事情,但是随着功能的增加,组合输出和优化器真正参与的能力会降低。

因此,使用任何一个最低限度可以让您表达您想要的结果。

于 2008-10-07T12:05:49.483 回答
50

函数必须是确定性的,不能用于对数据库进行更改,而存储过程允许您进行插入和更新等。

您应该限制函数的使用,因为它们对大型复杂查询造成了巨大的可伸缩性问题。它们成为查询优化器的“黑匣子”,您将看到使用函数和简单地将代码插入查询之间的巨大性能差异。

但在非常特殊的情况下,它们对于表值回报绝对有用。

如果您需要解析逗号分隔的列表,以模拟将数组传递给过程,函数可以为您将列表转换为表格。这是 Sql Server 2005 的常见做法,因为我们还不能将表传递给存储过程(我们可以使用 2008)。

于 2008-10-07T12:07:13.240 回答
46

从文档

如果存储过程满足以下条件,则可以将其重写为表值函数:

  • 该逻辑可以在单个 SELECT 语句中表达,但它是一个存储过程,而不是一个视图,只是因为需要参数。

  • 存储过程不执行更新操作,除了表变量。

  • 不需要动态 EXECUTE 语句。

  • 存储过程返回一个结果集。

  • 存储过程的主要目的是构建要加载到临时表中的中间结果,然后在 SELECT 语句中对其进行查询。

于 2008-10-07T12:16:10.757 回答
12

我将写一些存储过程和函数之间有趣的区别。

  • 我们可以在选择查询中使用函数,但我们不能在选择查询中使用存储过程。
  • 我们不能在函数中使用非确定性函数,但我们可以在存储过程中使用非确定性函数。现在问题来了,什么是非确定性函数..答案是:-

    非确定性函数是在不同时间为相同输入值返回不同输出的函数,例如 getdate()。每当它运行时,它总是返回不同的值。

    例外:-

    sql server 2000 之前的早期版本不允许在用户定义的函数中使用 getdate() 函数,但 2005 及更高版本允许我们在用户定义的函数中使用 getdate() 函数。

    Newid() 是非确定性函数的另一个例子,但不能用于用户定义的函数,但我们可以在存储过程中使用它。

  • 我们可以在存储过程中使用 DML(插入、更新、删除)语句,但不能在物理表或永久表的函数中使用 DML 语句。如果我们想在函数中进行 DML 操作,我们可以在表变量上而不是在永久表上进行。

  • 我们不能在函数中使用错误处理,但我们可以在存储过程中进行错误处理。

于 2014-01-18T13:04:57.063 回答
8
  1. 过程可以返回零或 n 个值,而函数可以返回一个强制值。

  2. 过程可以有输入/输出参数,而函数只能有输入参数。

  3. 过程允许在其中选择以及 DML 语句,而函数只允许在其中选择语句。

  4. 函数可以从过程中调用,而过程不能从函数中调用。

  5. 异常可以由过程中的 try-catch 块处理,而 try-catch 块不能在函数中使用。

  6. 我们可以在过程中进行事务管理,而不能在功能中进行。

  7. 过程不能在 select 语句中使用,而函数可以嵌入在 select 语句中。

  8. UDF(用户定义函数)可以在 SQL 语句中的 // 部分的任何位置使用,WHEREHAVING存储SELECT过程则不能。

  9. 返回表的 UDF 可以被视为另一个行集。这可以在JOINs 中与其他表一起使用。

  10. 内联 UDF 可以看作是接受参数的视图,并且可以在JOINs 和其他行集操作中使用。

于 2013-04-01T18:47:36.053 回答
6

例如,如果您有一个函数,则可以将其用作 SQL 语句的一部分

SELECT function_name(field1) FROM table

它不适用于存储过程。

于 2008-10-07T12:06:54.723 回答
6

我用长时间运行的逻辑运行了一些测试,在表值函数和存储过程以及直接的 EXEC/SELECT 中运行相同的代码位(长 SELECT 语句),并且每个执行相同。

在我看来,总是使用表值函数而不是存储过程来返回结果集,因为它使逻辑在随后加入它们的查询中更容易和可读,并且使您能够重用相同的逻辑。为了避免对性能造成太大影响,我经常使用“可选”参数(即您可以将 NULL 传递给它们)以使函数能够更快地返回结果集,例如:

CREATE FUNCTION dbo.getSitePermissions(@RegionID int, @optPersonID int, optSiteID int)
AS
RETURN 
    SELECT DISTINCT SiteID, PersonID
    FROM dbo.SiteViewPermissions
    WHERE (@optPersonID IS NULL OR @optPersonID = PersonID)
    AND (@optSiteID IS NULL OR @optSiteID = SiteID)
    AND @RegionID = RegionID

通过这种方式,您可以在许多不同的情况下使用此功能,并且不会对性能造成巨大影响。我相信这比事后过滤更有效:

SELECT * FROM dbo.getSitePermissions(@RegionID) WHERE SiteID = 1

我在几个函数中使用了这种技术,有时还有一长串这种类型的“可选”参数。

于 2011-07-27T06:16:07.067 回答
4

当我返回的只是一个没有影响的表时,我个人使用表值函数。基本上,我将它们视为参数化视图。

如果我需要返回多个记录集或者表中会有更新的值,我会使用存储过程。

我的 2 美分

于 2008-10-07T12:06:35.550 回答
4

如上所述,函数更具可读性/可组合性/自我记录,但通常性能较差,如果您在连接中对它们感到厌烦,可能会严重降低性能,例如

SELECT *
FROM dbo.tvfVeryLargeResultset1(@myVar1) tvf1
INNER JOIN dbo.tvfVeryLargeResultset1(@myVar2) tvf2
    ON (tvf1.JoinId = tvf2.JoinId)

通常,您只需要接受 tvf 可以消除的代码冗余(以不可接受的性能成本为代价)。

我还没有提到的另一点是,您不能在多语句 tvf 中使用数据库状态更改临时表。 与临时表在功能上最等效的机制是不改变状态的内存表变量,对于大型数据集,临时表可能比表变量更高效。(其他替代方案包括动态表和公用表值表达式,但在一定程度的复杂性下,这些不再是 IMO 的好选择。)

于 2008-10-23T01:10:10.987 回答
1

这取决于:) 如果您想在另一个过程中使用表值结果,您最好使用 TableValued 函数。如果结果是针对客户端的,则存储过程通常是更好的选择。

于 2008-10-07T12:08:28.917 回答
1

我会对两者进行性能测试。sp 方法或派生表可能比函数快得多,如果是这样,则应使用该方法。一般来说,我会避免使用函数,因为它们可能会消耗性能。

于 2008-10-07T21:45:10.343 回答
-1

存储过程是预编译的查询,执行速度更快,并从 sql 注入中保存。它们可以返回 0 或 N 个值。我们可以在存储过程中执行 DML 操作。我们可以在过程中使用函数,也可以在选择查询中使用函数。函数用于返回函数中不可能的任何值和 DML 操作。函数有标量和表值两种类型。标量函数返回单个值,用于返回表行的表值函数。

于 2019-12-25T12:25:46.717 回答