这是我的df
(data.frame):
group value
1 10
1 20
1 25
2 5
2 10
2 15
我需要按组计算连续行中的值之间的差异。
所以,我需要一个这样的结果。
group value diff
1 10 NA # because there is a no previous value
1 20 10 # value[2] - value[1]
1 25 5 # value[3] value[2]
2 5 NA # because group is changed
2 10 5 # value[5] - value[4]
2 15 5 # value[6] - value[5]
虽然,我可以通过使用来处理这个问题ddply
,但它需要太多时间。这是因为我的df
. (我的超过 1,000,000 个群组df
)
有没有其他有效的方法来处理这个问题?