sql - SQL：计算每列中不同值的数量

Question

我需要一个查询，它将返回一个表，其中每列是另一个表的列中不同值的计数。

我知道如何计算一列中的不同值：

select count(distinct columnA) from table1;

我想我可以把它变成一个很长的选择子句：

select count(distinct columnA), count(distinct columnB), ... from table1;

但这不是很优雅，而且是硬编码的。我更喜欢更灵活的东西。

score 4 · Accepted Answer

试试这个（sql server 2005 语法）：

DECLARE @YourTable table (col1  varchar(5)
                         ,col2  int
                         ,col3  datetime
                         ,col4  char(3)
                         )

insert into @YourTable values ('abcdf',123,'1/1/2009','aaa')
insert into @YourTable values ('aaaaa',456,'1/2/2009','bbb')
insert into @YourTable values ('bbbbb',789,'1/3/2009','aaa')
insert into @YourTable values ('ccccc',789,'1/4/2009','bbb')
insert into @YourTable values ('aaaaa',789,'1/5/2009','aaa')
insert into @YourTable values ('abcdf',789,'1/6/2009','aaa')


;with RankedYourTable AS
(
SELECT
    ROW_NUMBER() OVER(PARTITION by col1 order by col1) AS col1Rank
        ,ROW_NUMBER() OVER(PARTITION by col2 order by col2) AS col2Rank
        ,ROW_NUMBER() OVER(PARTITION by col3 order by col3) AS col3Rank
        ,ROW_NUMBER() OVER(PARTITION by col4 order by col4) AS col4Rank
    FROM @YourTable
)
SELECT
    SUM(CASE WHEN      col1Rank=1 THEN 1 ELSE 0 END) AS col1DistinctCount
        ,SUM(CASE WHEN col2Rank=1 THEN 1 ELSE 0 END) AS col2DistinctCount
        ,SUM(CASE WHEN col3Rank=1 THEN 1 ELSE 0 END) AS col3DistinctCount
        ,SUM(CASE WHEN col4Rank=1 THEN 1 ELSE 0 END) AS col4DistinctCount
    FROM RankedYourTable

输出：

col1DistinctCount col2DistinctCount col3DistinctCount col4DistinctCount
----------------- ----------------- ----------------- -----------------
4                 3                 6                 2

(1 row(s) affected)

score 3 · Accepted Answer

此代码应该为您提供“table1”中的所有列，每个列都有各自的不同值计数作为数据。

DECLARE @TableName VarChar (Max) = 'table1'
DECLARE @SqlString VarChar (Max)

set @SqlString = (
  SELECT DISTINCT
    'SELECT ' + 
        RIGHT (ColumnList, LEN (ColumnList)-1) + 
      ' FROM ' + Table_Name
    FROM INFORMATION_SCHEMA.COLUMNS COL1
      CROSS AppLy (
        SELECT ', COUNT (DISTINCT [' + COLUMN_NAME + ']) AS ' + '''' + COLUMN_NAME + ''''
          FROM INFORMATION_SCHEMA.COLUMNS COL2
          WHERE COL1.TABLE_NAME = COL2.TABLE_NAME
          FOR XML PATH ('')
      ) TableColumns (ColumnList)
    WHERE
      1=1 AND 
      COL1.TABLE_NAME = @TableName
)

EXECUTE (@SqlString)

score 1 · Accepted Answer

它是硬编码的。

为 sql 语句提供字段列表不是硬编码。这是常见且可接受的做法。

score 0 · Accepted Answer

这不一定适用于表中的每个字段。例如，您不能对 SQL Server ntext 或 image 字段执行 DISTINCT，除非您将它们转换为其他数据类型并丢失一些精度。

score -1 · Accepted Answer

我感谢所有的回应。我认为在这种情况下最适合我的解决方案（从除了表名之外不知道表的外部程序计算表的每一列中不同值的数量）如下：

运行“describe table1”并从结果中提取列名。

遍历列名并创建查询以计算每列中的不同值。查询将类似于“select count(distinct columnA), count(distinct columnB), ... from table1”。

score -3 · Accepted Answer

-3

DISTINCT 是邪恶的。计数/分组依据

于 2009-09-01T17:47:11.167 回答

sql - SQL：计算每列中不同值的数量

6 回答 6

Related

Reference