sql-server-2008-r2 - 计算按日期范围拆分的值的先前出现次数

Question

这是我们针对营销部门针对过去 90 天内收到的潜在客户的临时请求所做的简单查询。

SELECT ID
    ,FIRST_NAME
    ,LAST_NAME
    ,ADDRESS_1
    ,ADDRESS_2
    ,CITY
    ,STATE
    ,ZIP
    ,HOME_PHONE
    ,MOBILE_PHONE
    ,EMAIL_ADDRESS
    ,ROW_ADDED_DTM
FROM WEB_LEADS
WHERE ROW_ADDED_DTM BETWEEN @START AND @END

他们要求添加更多派生列，以显示 EMAIL_ADDRESS 匹配的 ADDRESS_1 先前出现的次数。但他们想要的是不同的日期范围。

所以派生列看起来像这样：

,COUNT_ADDRESS_1_LAST_1_DAYS,
,COUNT_ADDRESS_1_LAST_7_DAYS
,COUNT_ADDRESS_1_LAST_14_DAYS
etc.

当只有几个时，我使用更新语句手动填充了这些派生列。上面的查询实际上只是一个包含更多列的更大查询的示例。实际请求已扩展到 13 列的 6 个日期范围。我在问是否有比使用 78 个附加更新语句更好的方法。

score 2 · Accepted Answer

我认为如果没有实际创建一个硬编码不同选择的查询，您将很难编写一个包含每个电子邮件地址的所有这 78 个指标的查询。但是，您可以使用动态 SQL 生成这样的数据透视查询，这将为您节省一些击键，并且会随着您向表中添加更多列而动态调整。

您想要最终得到的结果将如下所示（但您当然不想输入它）：

;WITH y AS
(
  SELECT 
    EMAIL_ADDRESS,

/* aggregation portion */

    [ADDRESS_1] = COUNT(DISTINCT [ADDRESS_1]),
    [ADDRESS_2] = COUNT(DISTINCT [ADDRESS_2]),
    ... other columns

/* end agg portion */

    FROM dbo.WEB_LEADS AS wl 
    WHERE ROW_ADDED_DTM >= /* one of 6 past dates */
    GROUP BY wl.EMAIL_ADDRESS
)
SELECT EMAIL_ADDRESS,

/* pivot portion */

  COUNT_ADDRESS_1_LAST_1_DAYS = *count address 1 from 1 day ago*,
  COUNT_ADDRESS_1_LAST_7_DAYS = *count address 1 from 7 days ago*,
  ... other date ranges ...
  COUNT_ADDRESS_2_LAST_1_DAYS = *count address 2 from 1 day ago*,
  COUNT_ADDRESS_2_LAST_7_DAYS = *count address 2 from 7 days ago*,
  ... other date ranges ...
  ... repeat for 11 more columns ...

/* end pivot portion */
FROM y 
GROUP BY EMAIL_ADDRESS
ORDER BY EMAIL_ADDRESS;

这有点涉及，它应该作为一个脚本运行，但我将把它分解成块，以散布关于如何在不键入它们的情况下填充上述部分的评论。（不久之后，@Bluefeet 可能会出现更好的 PIVOT 替代方案。）我将附上我散布的评论，/* */以便您仍然可以将此答案的大部分复制到 Management Studio 中，并在完整评论的情况下运行它。

要复制的代码/注释如下：

/* 首先，让我们构建一个日期表，它既可以用于导出标签以进行透视，也可以帮助聚合。我已经添加了您提到的三个范围并猜测第四个，但希望很清楚如何添加更多：*/

DECLARE @d DATE = SYSDATETIME();

CREATE TABLE #L(label NVARCHAR(15), d DATE);

INSERT #L(label, d) VALUES
(N'LAST_1_DAYS',  DATEADD(DAY,   -1,  @d)),
(N'LAST_7_DAYS',  DATEADD(DAY,   -8,  @d)),
(N'LAST_14_DAYS', DATEADD(DAY,   -15, @d)),
(N'LAST_MONTH',   DATEADD(MONTH, -1,  @d));

/* 接下来，让我们构建每个列名重复的查询部分。首先，聚合部分只是格式col = COUNT(DISTINCT col)。我们将转到目录视图以动态导出列名列表（除了ID和）EMAIL_ADDRESS并将ROW_ADDED_DTM它们填充到 #temp 表中以供重复使用。*/

SELECT name INTO #N FROM sys.columns
WHERE [object_id] = OBJECT_ID(N'dbo.WEB_LEADS')
AND name NOT IN (N'ID', N'EMAIL_ADDRESS', N'ROW_ADDED_DTM');

DECLARE @agg NVARCHAR(MAX) = N'', @piv NVARCHAR(MAX) = N'';

SELECT @agg += ',
  ' + QUOTENAME(name) + ' = COUNT(DISTINCT ' 
  + QUOTENAME(name) + ')' FROM #N;

PRINT @agg;

/* 接下来我们将构建“pivot”部分（尽管我正在寻找穷人的支点——一堆CASE表达式）。对于每个列名，我们需要针对每个范围的条件，因此我们可以通过将列名列表与标签表交叉连接来完成此操作。（我们稍后将在查询中再次使用这种精确技术来使该/* one of past 6 dates */部分工作。*/

SELECT @piv += ',
  COUNT_' + n.name + '_' + l.label
  + ' = MAX(CASE WHEN label = N''' + l.label 
  + ''' THEN ' + QUOTENAME(n.name) + ' END)'
FROM #N as n CROSS JOIN #L AS l;

PRINT @piv;

/* 现在，根据我们的需要填充这两个部分，我们可以构建一个动态 SQL 语句来填充其余部分：*/

DECLARE @sql NVARCHAR(MAX) = N';WITH y AS
(
    SELECT 
      EMAIL_ADDRESS, l.label' + @agg + '
      FROM dbo.WEB_LEADS AS wl 
      CROSS JOIN #L AS l
      WHERE wl.ROW_ADDED_DTM >= l.d
      GROUP BY wl.EMAIL_ADDRESS, l.label
)
SELECT EMAIL_ADDRESS' + @piv + '
FROM y 
GROUP BY EMAIL_ADDRESS
ORDER BY EMAIL_ADDRESS;';

PRINT @sql;

EXEC sp_executesql @sql;
GO
DROP TABLE #N, #L;

/* 再说一遍，这是一段相当复杂的代码，也许可以用PIVOT. 但我认为即使@Bluefeet 也会编写一个PIVOT使用动态SQL 的版本，因为恕我直言，这里的硬编码太多了。*/

sql-server-2008-r2 - 计算按日期范围拆分的值的先前出现次数

1 回答 1

Related

Reference