1

在我的数据中,我有订单顺序和时间的库存量,我需要通过抓住链时间的下一部分来遍历订单的每个部分并找到它何时结束。

我刚从 python 开始,我会通过将每个股票子集到自己的池中来做到这一点,然后添加然后执行另一个循环来查找该序列的下一个订单的时间。最终,在 R/Matlab 中你可以去X$time[1:end-1] <- X$time[2:end,]

我的问题:我可以使用df.groupby['sequence'].{for each entry get the time from the subsequent entry}???

我想last()会给我整个序列的最后一个值,我想要下一个序列开始/出现的时间

我有一组类型:

sequence time
a        1
b        1
a        3
a        5
b        2

我想

sequence time  nexttime
a        1       3
b        1       2
a        3       5
a        5       999
b        2       999
4

1 回答 1

4
In [24]: df
Out[24]: 
  sequence  time
0        a     1
1        b     1
2        a     3
3        a     5
4        b     2

In [25]: df['nexttime'] = df.groupby('sequence').time.shift(-1).fillna(999)

In [26]: df
Out[26]: 
  sequence  time  nexttime
0        a     1         3
1        b     1         2
2        a     3         5
3        a     5       999
4        b     2       999
于 2012-12-29T00:00:31.820 回答