-2

这是一个猪拉丁问题。我的数据有3个字段如下:

时间距离

020204 09:23:45 350.1103

020204 09:29:48 350.1522

222292 14:01:34 1.992134

我想删除一行,如果有另一行具有相同的usid,这样两行之间的时间间隔小于10分钟。例如,必须删除第 2 行,因为第 1 行具有相同的 usrid,而第 2 行之间的时间间隔仅为约 6 分钟。

4

1 回答 1

0

请参考这个,

Pig 重复事件在 1 分钟内发生

一样的要求。滑动时间窗口。问题中有可能的解决方案/建议

于 2013-07-17T00:52:56.933 回答