如果我有一个 id 重复行的表,
我可以使用 Hive 和以下查询找到它
create table dupe as select * from table1 group by id having count(*) > 1;
我们可以使用 Pig 执行相同的功能吗?
如果是的话,有人可以帮我吗?
如果我有一个 id 重复行的表,
我可以使用 Hive 和以下查询找到它
create table dupe as select * from table1 group by id having count(*) > 1;
我们可以使用 Pig 执行相同的功能吗?
如果是的话,有人可以帮我吗?