4

在我开始之前,我知道你不能从 UDF 调用存储过程,而且我知道这有各种“原因”(不过对我来说没有多大意义,这听起来像是微软的懒惰)。

我对如何设计一个系统来绕过 SQL Server 中的这个缺陷更感兴趣。

这是我目前拥有的系统的快速概述:

  • 我有一个动态报告生成器,用户可以在其中指定数据项、运算符(=、<、!= 等)和过滤器值。这些用于构建带有一个或多个过滤器的“规则”,例如,我可能有一个具有两个过滤器“Category < 12”和“Location != 'York'”的规则;

  • 有成千上万的这些“规则”,其中一些有很多很多的过滤器;

  • 这些规则中的每一个的输出都是一个法定报告,它总是具有完全相同的“形状”,即相同的列/数据类型。基本上,这些报告会产生吨位和材料清单;

  • 我有一个标量值函数,它为指定的规则生成动态 SQL,并将其作为 VARCHAR(MAX); 返回

  • 我有一个被调用来运行特定规则的存储过程,它调用 UDF 来生成动态 SQL,运行它并返回结果(这过去只是返回结果,但现在我将输出存储在进程键控表中使数据更易于共享,因此我改为返回此数据的句柄);

  • 我有一个存储过程,它被调用来运行特定公司的所有规则,因此它列出了要运行的规则,按顺序运行它们,然后将结果合并在一起作为输出。

所以这一切都很完美。

现在我想要最后一件事,一份运行公司摘要的报告,然后将成本应用于吨位/材料以产生成本报告。当我上周开始时,这似乎是一个如此简单的要求:'(

我的报告必须是一个表值函数,才能与我已经编写的报告代理系统一起使用。如果我将其编写为存储过程,那么它将不会通过我的报告代理运行,这意味着它将不受控制,即我不知道谁运行了报告以及何时运行。

但是我不能从表值函数中调用存储过程,两种明显的处理方法如下:

  1. 获取 SQL 以创建输出,运行它并吸收结果。

    --Method #1
    WHILE @RuleIndex <= @MaxRuleIndex
    BEGIN
    DECLARE @DSFId UNIQUEIDENTIFIER;
    SELECT @DSFId = [GUID] FROM NewGUID; --this has to be deterministic, it isn't but the compiler thinks it is and that's good enough :D
    DECLARE @RuleId UNIQUEIDENTIFIER;
    SELECT @RuleId = DSFRuleId FROM @DSFRules WHERE DSFRuleIndex = @RuleIndex;
    DECLARE @SQL VARCHAR(MAX);
    
    --Get the SQL
    SELECT @SQL = DSF.DSFEngine(@ServiceId, @MemberId, @LocationId, @DSFYear, NULL, NULL, NULL, NULL, @DSFId, @RuleId);
    
    --Run it
    EXECUTE(@SQL);
    
    --Copy the data out of the results table into our local copy
    INSERT INTO 
        @DSFResults 
    SELECT 
        TableId, TableCode, TableName, RowId, RowName, LocationCode, LocationName, ProductCode, ProductName, PackagingGroupCode, PackagingGroupName, LevelName, WeightSource, Quantity, Paper, Glass, Aluminium, Steel, Plastic, Wood, Other, 0 AS General 
    FROM 
        DSF.DSFPackagingResults 
    WHERE 
        DSFId = @DSFId 
        AND RuleId = @RuleId;
    SELECT @RuleIndex = @RuleIndex + 1;
    END;
    
  2. 直接调用报告

    --Method #2
    WHILE @RuleIndex <= @MaxRuleIndex
    BEGIN
     DECLARE @DSFId UNIQUEIDENTIFIER;
    SELECT @DSFId = [GUID] FROM NewGUID; --this has to be deterministic, it isn't but the compiler thinks it is :D
    DECLARE @RuleId UNIQUEIDENTIFIER;
    SELECT @RuleId = DSFRuleId FROM @DSFRules WHERE DSFRuleIndex = @RuleIndex;
    DECLARE @SQL VARCHAR(MAX);
    
    --Run the report
    EXECUTE ExecuteDSFRule @ServiceId, @MemberId, @LocationId, @DSFYear, NULL, NULL, NULL, @RuleId, @DSFId, 2;
    
    --Copy the data out of the results table into our local copy
    INSERT INTO 
        @DSFResults 
    SELECT 
        TableId, TableCode, TableName, RowId, RowName, LocationCode, LocationName, ProductCode, ProductName, PackagingGroupCode, PackagingGroupName, LevelName, WeightSource, Quantity, Paper, Glass, Aluminium, Steel, Plastic, Wood, Other, 0 AS General 
    FROM 
        DSF.DSFPackagingResults 
    WHERE 
        DSFId = @DSFId 
        AND RuleId = @RuleId;
    SELECT @RuleIndex = @RuleIndex + 1;
    END;
    

我可以想到以下解决方法(没有一个特别令人满意):

  • 在 CLR 中重写其中的一些(但这只是打破规则的一大堆麻烦);

  • 使用存储过程来生成我的报告(但这意味着我失去了对执行的控制,除非我为这个 SINGLE 报告开发一个新系统,这与现有的几十个工作正常的报告不同);

  • 将执行与报告分开,因此我有一个流程来执行报告,而另一个流程只是获取输出(但如果没有更多工作,就无法判断报告何时完成);

  • 等到 Microsoft 认为有意义并允许从 UDF 执行存储过程。

还有其他想法吗?


编辑 2013 年 5 月 3 日,这是一个(非常)简单的例子,说明它是如何挂在一起的:

--Data to be reported
CREATE TABLE DataTable (
    MemberId INT,
    ProductId INT,
    ProductSize VARCHAR(50),
    Imported INT,
    [Weight] NUMERIC(19,2));
INSERT INTO DataTable VALUES (1, 1, 'Large', 0, 5.4);
INSERT INTO DataTable VALUES (1, 2, 'Large', 1, 6.2);
INSERT INTO DataTable VALUES (1, 3, 'Medium', 0, 2.3);
INSERT INTO DataTable VALUES (1, 4, 'Small', 1, 1.9);
INSERT INTO DataTable VALUES (1, 5, 'Small', 0, 0.7);
INSERT INTO DataTable VALUES (1, 6, 'Small', 1, 1.2);

--Report Headers
CREATE TABLE ReportsTable (
    ReportHandle INT,
    ReportName VARCHAR(50));
INSERT INTO ReportsTable VALUES (1, 'Large Products');
INSERT INTO ReportsTable VALUES (2, 'Imported Small Products');

--Report Detail
CREATE TABLE ReportsDetail (
    ReportHandle INT,
    ReportDetailHandle INT,
    DatabaseColumn VARCHAR(50),
    DataType VARCHAR(50),
    Operator VARCHAR(3),
    FilterValue VARCHAR(50));
INSERT INTO ReportsDetail VALUES (1, 1, 'ProductSize', 'VARCHAR', '=', 'Large');
INSERT INTO ReportsDetail VALUES (2, 1, 'Imported', 'INT', '=', '1');
INSERT INTO ReportsDetail VALUES (2, 1, 'ProductSize', 'VARCHAR', '=', 'Small');
GO
CREATE FUNCTION GenerateReportSQL (
    @ReportHandle INT)
RETURNS VARCHAR(MAX)
AS
BEGIN
    DECLARE @SQL VARCHAR(MAX);
    SELECT @SQL = 'SELECT SUM([Weight]) FROM DataTable WHERE 1=1 ';
    DECLARE @Filters TABLE (
        FilterIndex INT,
        DatabaseColumn VARCHAR(50),
        DataType VARCHAR(50),
        Operator VARCHAR(3),
        FilterValue VARCHAR(50));
    INSERT INTO @Filters SELECT ROW_NUMBER() OVER (ORDER BY DatabaseColumn), DatabaseColumn, DataType, Operator, FilterValue FROM ReportsDetail WHERE ReportHandle = @ReportHandle;
    DECLARE @FilterIndex INT = NULL;
    SELECT TOP 1 @FilterIndex = FilterIndex FROM @Filters;
    WHILE @FilterIndex IS NOT NULL
    BEGIN
        SELECT TOP 1 @SQL = @SQL + ' AND ' + DatabaseColumn + ' ' + Operator + ' ' + CASE WHEN DataType = 'VARCHAR' THEN '''' ELSE '' END + FilterValue + CASE WHEN DataType = 'VARCHAR' THEN '''' ELSE '' END FROM @Filters WHERE FilterIndex = @FilterIndex;
        DELETE FROM @Filters WHERE FilterIndex = @FilterIndex;
        SELECT @FilterIndex = NULL;
        SELECT TOP 1 @FilterIndex = FilterIndex FROM @Filters;
    END;
    RETURN @SQL;
END;
GO
CREATE PROCEDURE ExecuteReport (
    @ReportHandle INT)
AS
BEGIN
    --Get the SQL
    DECLARE @SQL VARCHAR(MAX);
    SELECT @SQL = dbo.GenerateReportSQL(@ReportHandle);
    EXECUTE (@SQL);
END;
GO
--Test
EXECUTE ExecuteReport 1;
EXECUTE ExecuteReport 2;
SELECT dbo.GenerateReportSQL(1);
SELECT dbo.GenerateReportSQL(2);
GO
--What I really want
CREATE FUNCTION RunReport (
    @ReportHandle INT)
RETURNS @Results TABLE ([Weight] NUMERIC(19,2))
AS
BEGIN
    INSERT INTO @Results EXECUTE ExecuteReport @ReportHandle;
    RETURN;
END;
--Invalid use of a side-effecting operator 'INSERT EXEC' within a function
4

2 回答 2

2

如果我处于你的情况,我不会尝试破解任何东西。我会像这样设置对象:

CREATE TABLE [dbo].[ReportCollection] (
    [ReportCollectionID] int,
    [ReportID] int
)

CREATE TABLE [dbo].[ReportResult] (
    [ReportID] int,
    [LocationCode] int,
    [LocationName] nvarchar(max)
)

CREATE PROCEDURE [dbo].[usp_ExecuteReport] (
    @ReportID int
)
AS
    INSERT [dbo].[ReportResult]
    SELECT @ReportID, 1, N'StackOverflow'
END

CREATE FUNCTION [dbo].[udf_RetrieveReportCollectionResults] (
    @ReportCollectionID int
)
RETURNS @Results TABLE ([ReportID], [LocationCode], [LocationName])
AS
BEGIN
    SELECT *
    FROM [dbo].[ReportResult] rr
    JOIN [dbo].[ReportCollection] rc
        ON rr.ReportID = rc.ReportID
    WHERE rc.ReportCollectionID = @ReportCollectionID
END

并像这样使用它们:

INSERT [dbo].[ReportCollection] VALUES (1, 1)
INSERT [dbo].[ReportCollection] VALUES (1, 2)

EXEC [dbo].[usp_ExecuteReport] @ReportID = 1
EXEC [dbo].[usp_ExecuteReport] @ReportID = 2

SELECT * FROM [dbo].[udf_RetrieveReportCollectionResults](1)

每次运行报告时,开始一个新的集合。您的应用程序应该启动所有报告并在之后合并结果。

--

如果您真的想从 udf 调用存储过程(请不要),请在 xp_cmdshell 上进行搜索。

于 2013-05-14T05:50:25.703 回答
0

如果你真的希望它作为一个函数工作,那么最简单的方法就是 CLR 集成。

您不必重做所有事情 - 只需编写一个 CLR 包装函数,该函数调用存储过程并返回存储的 procs 结果集,因为它是自己的。1

这样,您当前的所有 SQL 开发都不会受到影响。

于 2013-09-27T13:41:01.270 回答