2

我有这种格式的数据:

Category Session_ID  Step_Name

  A         100        1
  A         100        2 
  A         200        1
  A         200        1    <--
  A         200        1    <--
  A         200        2
  B         300        1
  B         300        1    <--

我需要删除每个 Session_ID中步骤名称的重复值。例如在 ID = 200 中,有三个 '1' 需要更改为一个 '1',所以最终数据如下所示:

Category Session_ID  Step_Name

  A         100        1
  A         100        2 
  A         200        1
  A         200        2
  B         300        1
4

1 回答 1

6

您应该在您的情况下使用distinct 运算符

your_table
| distinct Category, Session_ID, Step_Name

然后您可以获得如下所示的预期输出,它在我身边有效:

Category Session_ID  Step_Name

  A         100        1
  A         100        2 
  A         200        1
  A         200        2
  B         300        1

对于您在评论中的问题,如果您使用上述查询,则“A 100 1”之类的记录将被视为一个实体,并且只有当有 2 个或更多完全相同的记录(例如“A 100 1”)时,才会仅保留 1如果使用 distinct 则记录。

如果有另一条记录,如“B 100 1”,则两条记录“A 100 1”和“B 100 1”都将保留。

于 2019-10-21T06:57:56.697 回答