我正在尝试构建一个查询,告诉我给定数据集中有多少不同的女性和男性。该人由数字“电话”标识。同一个“tel”有可能出现多次,但那个“tel”的性别只能计算一次!
7136609221 - 男性
7136609222 - 男性
7136609223 - 女性
7136609228 - 男性
7136609222 - 男性
7136609223 - 女性
此 example_dataset 将产生以下内容。
独特性别总数:4
独特男性总数:3
独特女性总数:1
我尝试的查询:
SELECT COUNT(DISTINCT tel, gender) as gender_count,
COUNT(DISTINCT tel, gender = 'male') as man_count,
SUM(if(gender = 'female', 1, 0)) as woman_count
FROM example_dataset;
里面其实有两次尝试。COUNT(DISTINCT tel, gender = 'male') as man_count
似乎只是返回与COUNT(DISTINCT tel, gender)
-- 它没有考虑那里的限定符。并且SUM(if(gender = 'female', 1, 0))
计算所有女性记录,但不被 DISTINCT 电话过滤。