在我开始之前,我知道你不能从 UDF 调用存储过程,而且我知道这有各种“原因”(不过对我来说没有多大意义,这听起来像是微软的懒惰)。
我对如何设计一个系统来绕过 SQL Server 中的这个缺陷更感兴趣。
这是我目前拥有的系统的快速概述:
我有一个动态报告生成器,用户可以在其中指定数据项、运算符(=、<、!= 等)和过滤器值。这些用于构建带有一个或多个过滤器的“规则”,例如,我可能有一个具有两个过滤器“Category < 12”和“Location != 'York'”的规则;
有成千上万的这些“规则”,其中一些有很多很多的过滤器;
这些规则中的每一个的输出都是一个法定报告,它总是具有完全相同的“形状”,即相同的列/数据类型。基本上,这些报告会产生吨位和材料清单;
我有一个标量值函数,它为指定的规则生成动态 SQL,并将其作为 VARCHAR(MAX); 返回
我有一个被调用来运行特定规则的存储过程,它调用 UDF 来生成动态 SQL,运行它并返回结果(这过去只是返回结果,但现在我将输出存储在进程键控表中使数据更易于共享,因此我改为返回此数据的句柄);
我有一个存储过程,它被调用来运行特定公司的所有规则,因此它列出了要运行的规则,按顺序运行它们,然后将结果合并在一起作为输出。
所以这一切都很完美。
现在我想要最后一件事,一份运行公司摘要的报告,然后将成本应用于吨位/材料以产生成本报告。当我上周开始时,这似乎是一个如此简单的要求:'(
我的报告必须是一个表值函数,才能与我已经编写的报告代理系统一起使用。如果我将其编写为存储过程,那么它将不会通过我的报告代理运行,这意味着它将不受控制,即我不知道谁运行了报告以及何时运行。
但是我不能从表值函数中调用存储过程,两种明显的处理方法如下:
获取 SQL 以创建输出,运行它并吸收结果。
--Method #1 WHILE @RuleIndex <= @MaxRuleIndex BEGIN DECLARE @DSFId UNIQUEIDENTIFIER; SELECT @DSFId = [GUID] FROM NewGUID; --this has to be deterministic, it isn't but the compiler thinks it is and that's good enough :D DECLARE @RuleId UNIQUEIDENTIFIER; SELECT @RuleId = DSFRuleId FROM @DSFRules WHERE DSFRuleIndex = @RuleIndex; DECLARE @SQL VARCHAR(MAX); --Get the SQL SELECT @SQL = DSF.DSFEngine(@ServiceId, @MemberId, @LocationId, @DSFYear, NULL, NULL, NULL, NULL, @DSFId, @RuleId); --Run it EXECUTE(@SQL); --Copy the data out of the results table into our local copy INSERT INTO @DSFResults SELECT TableId, TableCode, TableName, RowId, RowName, LocationCode, LocationName, ProductCode, ProductName, PackagingGroupCode, PackagingGroupName, LevelName, WeightSource, Quantity, Paper, Glass, Aluminium, Steel, Plastic, Wood, Other, 0 AS General FROM DSF.DSFPackagingResults WHERE DSFId = @DSFId AND RuleId = @RuleId; SELECT @RuleIndex = @RuleIndex + 1; END;
直接调用报告
--Method #2 WHILE @RuleIndex <= @MaxRuleIndex BEGIN DECLARE @DSFId UNIQUEIDENTIFIER; SELECT @DSFId = [GUID] FROM NewGUID; --this has to be deterministic, it isn't but the compiler thinks it is :D DECLARE @RuleId UNIQUEIDENTIFIER; SELECT @RuleId = DSFRuleId FROM @DSFRules WHERE DSFRuleIndex = @RuleIndex; DECLARE @SQL VARCHAR(MAX); --Run the report EXECUTE ExecuteDSFRule @ServiceId, @MemberId, @LocationId, @DSFYear, NULL, NULL, NULL, @RuleId, @DSFId, 2; --Copy the data out of the results table into our local copy INSERT INTO @DSFResults SELECT TableId, TableCode, TableName, RowId, RowName, LocationCode, LocationName, ProductCode, ProductName, PackagingGroupCode, PackagingGroupName, LevelName, WeightSource, Quantity, Paper, Glass, Aluminium, Steel, Plastic, Wood, Other, 0 AS General FROM DSF.DSFPackagingResults WHERE DSFId = @DSFId AND RuleId = @RuleId; SELECT @RuleIndex = @RuleIndex + 1; END;
我可以想到以下解决方法(没有一个特别令人满意):
在 CLR 中重写其中的一些(但这只是打破规则的一大堆麻烦);
使用存储过程来生成我的报告(但这意味着我失去了对执行的控制,除非我为这个 SINGLE 报告开发一个新系统,这与现有的几十个工作正常的报告不同);
将执行与报告分开,因此我有一个流程来执行报告,而另一个流程只是获取输出(但如果没有更多工作,就无法判断报告何时完成);
等到 Microsoft 认为有意义并允许从 UDF 执行存储过程。
还有其他想法吗?
编辑 2013 年 5 月 3 日,这是一个(非常)简单的例子,说明它是如何挂在一起的:
--Data to be reported
CREATE TABLE DataTable (
MemberId INT,
ProductId INT,
ProductSize VARCHAR(50),
Imported INT,
[Weight] NUMERIC(19,2));
INSERT INTO DataTable VALUES (1, 1, 'Large', 0, 5.4);
INSERT INTO DataTable VALUES (1, 2, 'Large', 1, 6.2);
INSERT INTO DataTable VALUES (1, 3, 'Medium', 0, 2.3);
INSERT INTO DataTable VALUES (1, 4, 'Small', 1, 1.9);
INSERT INTO DataTable VALUES (1, 5, 'Small', 0, 0.7);
INSERT INTO DataTable VALUES (1, 6, 'Small', 1, 1.2);
--Report Headers
CREATE TABLE ReportsTable (
ReportHandle INT,
ReportName VARCHAR(50));
INSERT INTO ReportsTable VALUES (1, 'Large Products');
INSERT INTO ReportsTable VALUES (2, 'Imported Small Products');
--Report Detail
CREATE TABLE ReportsDetail (
ReportHandle INT,
ReportDetailHandle INT,
DatabaseColumn VARCHAR(50),
DataType VARCHAR(50),
Operator VARCHAR(3),
FilterValue VARCHAR(50));
INSERT INTO ReportsDetail VALUES (1, 1, 'ProductSize', 'VARCHAR', '=', 'Large');
INSERT INTO ReportsDetail VALUES (2, 1, 'Imported', 'INT', '=', '1');
INSERT INTO ReportsDetail VALUES (2, 1, 'ProductSize', 'VARCHAR', '=', 'Small');
GO
CREATE FUNCTION GenerateReportSQL (
@ReportHandle INT)
RETURNS VARCHAR(MAX)
AS
BEGIN
DECLARE @SQL VARCHAR(MAX);
SELECT @SQL = 'SELECT SUM([Weight]) FROM DataTable WHERE 1=1 ';
DECLARE @Filters TABLE (
FilterIndex INT,
DatabaseColumn VARCHAR(50),
DataType VARCHAR(50),
Operator VARCHAR(3),
FilterValue VARCHAR(50));
INSERT INTO @Filters SELECT ROW_NUMBER() OVER (ORDER BY DatabaseColumn), DatabaseColumn, DataType, Operator, FilterValue FROM ReportsDetail WHERE ReportHandle = @ReportHandle;
DECLARE @FilterIndex INT = NULL;
SELECT TOP 1 @FilterIndex = FilterIndex FROM @Filters;
WHILE @FilterIndex IS NOT NULL
BEGIN
SELECT TOP 1 @SQL = @SQL + ' AND ' + DatabaseColumn + ' ' + Operator + ' ' + CASE WHEN DataType = 'VARCHAR' THEN '''' ELSE '' END + FilterValue + CASE WHEN DataType = 'VARCHAR' THEN '''' ELSE '' END FROM @Filters WHERE FilterIndex = @FilterIndex;
DELETE FROM @Filters WHERE FilterIndex = @FilterIndex;
SELECT @FilterIndex = NULL;
SELECT TOP 1 @FilterIndex = FilterIndex FROM @Filters;
END;
RETURN @SQL;
END;
GO
CREATE PROCEDURE ExecuteReport (
@ReportHandle INT)
AS
BEGIN
--Get the SQL
DECLARE @SQL VARCHAR(MAX);
SELECT @SQL = dbo.GenerateReportSQL(@ReportHandle);
EXECUTE (@SQL);
END;
GO
--Test
EXECUTE ExecuteReport 1;
EXECUTE ExecuteReport 2;
SELECT dbo.GenerateReportSQL(1);
SELECT dbo.GenerateReportSQL(2);
GO
--What I really want
CREATE FUNCTION RunReport (
@ReportHandle INT)
RETURNS @Results TABLE ([Weight] NUMERIC(19,2))
AS
BEGIN
INSERT INTO @Results EXECUTE ExecuteReport @ReportHandle;
RETURN;
END;
--Invalid use of a side-effecting operator 'INSERT EXEC' within a function