除了添加/截断分区之外,有没有办法避免在 U-SQL 表中添加重复记录。让我们假设两个记录只有唯一标识符不同。
问问题
450 次
2 回答
3
您还可以在 U-SQL 查询中使用 ROWNUMBER()
@transactions =
SELECT *,
ROW_NUMBER() OVER(PARTITION BY Id ORDER BY Id DESC) AS RowNumber
FROM @searchlog;
@result =
SELECT Id,Name,Description,Age
FROM @transactions
WHERE RowNumber == 1;
这将获得文件中的唯一记录。
于 2017-07-26T05:22:25.393 回答
2
由于可伸缩性有限,U-SQL 表不提供 UNIQUE 约束,因此您必须确保ANTI SEMIJOIN
在插入新数据之前使用唯一列来过滤掉新数据上可能存在的重复项。
于 2016-06-13T20:43:23.997 回答