3

我有一个带有标签列的表,其中包含大约 1000 个不同的标签。我想为每个不同的标签创建一个包含一列的新表,列名将是标签值。使用 T-SQL 是否有一种简单易用的方法来做到这一点?SQL Server 2005 及更高版本中的任何内容都可以。

这是我的意思的一个例子:

Table:
Tag    Value    Timestamp
tag1   123      ---
tag1   456      ---
tag2   854      ---
tag3   923      ---
 .
 .
 .
tag90  324      ---

New Table:
tag1    tag2    tag3 ... tag90
123     854     923      324
456 ...

更新:

我知道限制(表中的列数),但是列不会稀疏,并且任何列中都不会有空值或 0 值。

我想要这个表的原因是我想针对这个新表的列运行 SSAS 聚类算法。

4

2 回答 2

9

使用PIVOTtable 运算符,然后使用INTO子句从透视列创建一个新表。像这样的东西:

SELECT *
INTO newtablename
FROM ( SELECT tag, value FROM tags) AS t
PIVOT 
(
  MIN(value)
  FOR tag in ([tag1], [tag2], [tag3], [tag4])
) AS p;

在这里查看它的实际效果:


但是,在您的情况下,您必须使用动态 sql 为表中的任意数量的标签动态地执行此操作,而不是手动列出它们。像这样:

DECLARE @cols AS NVARCHAR(MAX);
DECLARE @query AS NVARCHAR(MAX);


select @cols = STUFF((SELECT distinct ',' +
                        QUOTENAME(tag)
                      FROM tags
                      FOR XML PATH(''), TYPE
                     ).value('.', 'NVARCHAR(MAX)') 
                        , 1, 1, '');

SELECT @query = 'SELECT *
                 INTO newtablename
                 FROM ( SELECT tag, value FROM tags) AS t
                 PIVOT 
                 (
                   MIN(value)
                   FOR tag in ( ' + @cols + ' )
                 ) AS p';

execute(@query);

在这里查看它的实际效果:

这将创建一个全新的表,其名称newtablename如下:

| TAG1 | TAG2 | TAG3 | TAG4 |
-----------------------------
|  123 |  854 |  923 |   44 |
于 2013-05-16T14:06:19.700 回答
6

普通 SQL Server 表中的最大列数为 1,024(请参见此处)。

您的请求危险地接近限制。因此,尽管在技术上是可行的,但强烈不建议这样做。出于这个目的,马哈茂德的回答似乎是正确的。

如果大多数值为 0/NULL,您可以调查包含“稀疏列”的称为“宽表”的东西。

如果您解释了为什么要执行此支点,那么您的问题可能还有其他解决方案。

我非常同情想要用 SQL 中的数据进行数据分析。在这里,通用选项:

  1. 将数据导入 SAS、SPSS 或 R。这些对列数没有任意限制。

  2. 将这些值连接到一个列中,可能用逗号分隔。然后可以很容易地将它带入另一个工具中。

  3. 使用对列数有更高限制的数据库,例如 Oracle 或 MySQL(仍然有较低的限制,但更好一点)。

  4. 使用称为垂直分区的技术将列放在单独的表中。由 Vertica 等数据库直接支持。可以由其他数据库实现。但是,您会遇到查询中允许的最大列数的问题。

对于您的特定问题,我强烈建议您研究聚类算法。K-means 可能不会在如此广泛的数据上给出很好的结果。我不知道 SSAS 是否支持 EM 集群,这可能会更好一些。您可以尝试将分析转换为关联规则问题。但严肃的方法是使用主成分转换数据并在较低维空间中进行聚类。

于 2013-05-16T14:18:42.207 回答