1

我有两列看起来像这样:

user_id  timestamp
3162507 "2016-11-15 21:26:58" 
3162507 "2016-11-15 21:28:13"
3180468 "2016-11-15 21:28:58"
3180468 "2016-11-15 21:29:47"
3180479 "2016-11-15 21:31:22"
3180479 "2016-11-15 21:31:35" ...

我想计算每个活动之间经过的时间。目前,我正在做一个循环。但是 R 循环很慢。

for (i in 1:nrow(df)){
  if (df$user_id[i] != df$user_id[i+1]){
    df$time[i] <- NA
  }else{
    df$time[i] <- difftime(df$timestamp[1+i],df$timestamp[i],units = "secs")
  }
}

有更好的方法吗?

4

1 回答 1

1
library(data.table)
df <- setDT(df)

result <- df[,list( time = difftime(timestamp-c(timestamp[2:.N],NA)),units = "secs"), by = user_id]

应该为连续的差异工作

于 2018-01-18T15:05:13.097 回答