2

除了添加/截断分区之外,有没有办法避免在 U-SQL 表中添加重复记录。让我们假设两个记录只有唯一标识符不同。

4

2 回答 2

3

您还可以在 U-SQL 查询中使用 ROWNUMBER()

@transactions =
   SELECT *,
   ROW_NUMBER() OVER(PARTITION BY Id ORDER BY Id DESC) AS RowNumber
   FROM @searchlog;

@result =
   SELECT Id,Name,Description,Age
   FROM @transactions
   WHERE RowNumber == 1;

这将获得文件中的唯一记录。

于 2017-07-26T05:22:25.393 回答
2

由于可伸缩性有限,U-SQL 表不提供 UNIQUE 约束,因此您必须确保ANTI SEMIJOIN在插入新数据之前使用唯一列来过滤掉新数据上可能存在的重复项。

于 2016-06-13T20:43:23.997 回答