想象一下以下数据框的片段:
ID ActivityName Time Type Shape
1 1 Request 0.000 Type_1 767
2 1 Request 600.000 Type_1 767
3 1 Start 600.000 Type_1 1376
4 1 Start 600.000 Type_1 1376
5 1 Delay 2962.295 Type_1 1022
6 1 Schedule Activities 600.000 Type_1 15
7 1 Schedule Activities 2062.295 Type_1 15
我要做的是根据ActivityName中的重复条目创建两个新列。
具体来说,我想将同一活动的两个后续行组合成一行,并带有开始和完成时间戳(从时间开始,以秒为单位)。
鉴于并非ActivityName中的所有条目都有匹配的第二个条目(但是,最多两个连续条目是相同的),我还想删除这样的行,在这种情况下为延迟。
然后它应该看起来像:
ID ActivityName StartTime EndTime Type Shape
1 1 Request 0.000 600.000 Type_1 767
2 1 Start 600.000 600.000 Type_1 1375
3 1 Schedule Activities 600.000 2062.295 Type_1 15
ActivityName中的所有类别在该列中出现多次。我希望不要比较它们的关联时间,而不是跨越整个列,只比较那些有两个连续相同出现的时间。
任何关于如何解决这个问题的想法都将受到高度赞赏。