3

我在两列中有数据:

DateTime    Profit
20130319T01  5
20130319T02  135
20130319T03  245
20130320T01  10
20130320T02  115

我想创建一个每小时都有差异的列,但问题是利润每天都重置为零。我想得到以下信息:

DateTime     Diff
20130319T01  5
20130319T02  130
20130319T03  110
20130320T01  10
20130320T02  105
4

1 回答 1

4

假设你的 DateTime 字符向量的格式总是"YYYYMMDD"那么你可以使用ddply函数 fromplyr来得到你想要的:

require(plyr)
df$Date <- substr( df$DateTime , 1 , 8 )
ddply( df ,  .(Date)  , summarise , Diff = diff(c(0,Profit)) )
#     Date Diff
#1 20130319    5
#2 20130319  130
#3 20130319  110
#4 20130320   10
#5 20130320  105

使用 base 的另一种方法ave

within(df, { Profit_diff <- ave(Profit, list(gsub("T.*$", "", DateTime)), 
             FUN=function(x) c(x[1], diff(x)))})

#      DateTime Profit Profit_diff
# 1 20130319T01      5           5
# 2 20130319T02    135         130
# 3 20130319T03    245         110
# 4 20130320T01     10          10
# 5 20130320T02    115         105
于 2013-05-03T10:38:41.020 回答