31

我正在尝试构建一个查询,告诉我给定数据集中有多少不同的女性和男性。该人由数字“电话”标识。同一个“tel”有可能出现多次,但那个“tel”的性别只能计算一次!

7136609221 - 男性
7136609222 - 男性
7136609223 - 女性
7136609228 - 男性
7136609222 - 男性
7136609223 - 女性

此 example_dataset 将产生以下内容。
独特性别总数:4
独特男性总数:3
独特女性总数:1

我尝试的查询:

SELECT COUNT(DISTINCT tel, gender) as gender_count, 
       COUNT(DISTINCT tel, gender = 'male') as man_count, 
       SUM(if(gender = 'female', 1, 0)) as woman_count 
FROM example_dataset;

里面其实有两次尝试。COUNT(DISTINCT tel, gender = 'male') as man_count似乎只是返回与COUNT(DISTINCT tel, gender)-- 它没有考虑那里的限定符。并且SUM(if(gender = 'female', 1, 0))计算所有女性记录,但不被 DISTINCT 电话过滤。

4

2 回答 2

84

这是使用子查询的一个选项DISTINCT

SELECT COUNT(*) gender_count,
   SUM(IF(gender='male',1,0)) male_count,
   SUM(IF(gender='female',1,0)) female_count
FROM (
   SELECT DISTINCT tel, gender
   FROM example_dataset
) t

如果您不想使用子查询,这也将起作用:

SELECT COUNT(DISTINCT tel) gender_count,
    COUNT(DISTINCT CASE WHEN gender = 'male' THEN tel END) male_count,  
    COUNT(DISTINCT CASE WHEN gender = 'female' THEN tel END) female_count
FROM example_dataset
于 2013-10-30T01:09:14.950 回答
8

还有另一个类似于@segeddes 的第二个解决方案的解决方案

Select COUNT(DISTINCT tel) as gender_count, 
       COUNT(DISTINCT IF(gender = "male", tel, NULL)) as male_count, 
       COUNT(DISTINCT IF(gender = "female", tel, NULL)) as female_count 
FROM example_dataset

解释 :

IF(gender = "male", tel, NULL)

如果性别为男性,上述表达式将返回 tel,否则将返回 NULL 值

然后我们已经

DISTINCT

它将删除所有重复项

最后

COUNT(DISTINCT IF(gender = "male", tel, NULL))

将计算所有不同出现的具有男性性别的行

注意:带有表达式的 SQL COUNT 函数只计算具有非 NULL 值的行,详细解释检查 - http://www.mysqltutorial.org/mysql-count/

于 2019-11-14T14:10:53.757 回答