0

我有一张桌子,其中两列如下所示:

Name        cars_owned
Adam        Audi
David       BMW
Steve       Ford
John        Audi
Adam        Audi
....This continues on for ~1,000 rows

我想要这样的输出:

cars_owned     count
Audi           3
BMW            1
Ford           1
...

问题是行可以重复,这意味着“亚当”和“奥迪”可能一起出现 100 次,但对于“亚当”这个名字,我希望它只算作奥迪计数的一个,无论它在表中出现多少次. 此外,“Adam”可能与“Audi”一起出现 20 次,但也与“BMW”一起出现 5 次,在这种情况下,我希望“Adam”只进入 Audi 计数,因为它出现的次数比 BMW 出现的次数多

我能够使用以下代码计算不同名称(247):

SELECT COUNT(DISTINCT Name)
FROM cars_table

现在我只需要将这 247 个不同的名称分解为正确的 cars_owned 类别即可获得计数

4

1 回答 1

1

您需要每个名称的最常见值,然后是分布。使用两个级别的聚合:

select car, count(*) as num_names, sum(cnt) as num_cars
from (select name, car, count(*) as cnt,
             row_number() over (partition by name order by count(*) desc) as seqnum
      from cars c
      group by name, car
     ) nc
where seqnum = 1
group by car;

注意:如果名称与最常见的汽车相同,则返回一个任意值。

于 2021-03-05T13:11:31.153 回答