我想为表中每个唯一的值组合添加唯一的数字。
样本数据:
create table tmp (
id int primary key,
a varchar,
b varchar,
c varchar,
d varchar,
f int
);
insert into tmp values (1,'a','b','e','h',1);
insert into tmp values (2,'a','b','e','h',2);
insert into tmp values (3,'a','b','e','h',3);
insert into tmp values (4,'b','c','f','i',2);
insert into tmp values (5,'b','c','f','i',1);
insert into tmp values (6,'b','c','f','i',2);
insert into tmp values (7,'c','d','g','j',3);
insert into tmp values (8,'c','d','g','j',1);
insert into tmp values (9,'c','d','g','j',2);
现在我需要为列a, b, c, d
和返回列的每个唯一组合id
和gid
(组标识符)分配编号
示例输出(例如 id 为 1,2 3 的行具有相同的列组合,a, b, c, d
因此这些行应具有相同的组标识符):
id;gid
1;2
2;2
3;2
4;3
5;3
6;3
7;1
8;1
9;1
我想出了以下解决方案,但我认为应该有更好(更快)的方法:
select
id,
gid
from
tmp
join (
select
a, b, c, d, row_number() over() as gid
from
tmp
group by
a, b, c, d) gids using (a, b, c, d)