4

我开始接触 R,而且我对时间序列概念是全新的。谁能指出我正确的方向来根据每日数据点计算每月的百分比变化?我想要每个月的第一个和最后一个数据点之间的变化。例如:

ts系列数据:

1/1/2000 10.00
...
1/31/2000 10.10
2/1/2000 10.20
...
2/28/2000 11.00

我正在寻找表单的返回数据框:

1/31/2000 .01
2/28/2000 .0784

理想情况下,我可以从上个月的终点计算到本月的终点,但我认为按月分区更容易作为起点。我正在查看软件包 zoo 和 xts,但仍然卡住了。有接盘侠吗?谢谢...

4

5 回答 5

2

这是使用plyrand的一种方法ddply。我按顺序使用 ddply,首先获取每个月的第一行和最后一行,然后再次计算monthlyReturn。 (也许使用 xts 或 zoo 可能更容易,我不确定。)

#Using plyr and the data in df
df$Date <- as.POSIXlt(as.Date(df$Date, "%m/%d/%Y"))
df$Month <- (df$Date$mon + 1) #0 = January

sdf <- df[,-1] #drop the Date Column, ddply doesn't like it

library("plyr")
#this function is called with 2 row data frames
monthlyReturn<- function(df) {
  (df$Value[2] - df$Value[1])/(df$Value[1])  
}

adf <- ddply(sdf, .(Month), function(x) x[c(1, nrow(x)), ]) #get first and last values for each Month   
mon.returns <- ddply(adf, .(Month), monthlyReturn)

这是我用来测试它的数据:

> df
         Date Value
1    1/1/2000  10.0
2   1/31/2000  10.1
3    2/1/2000  10.2
4   2/28/2000  11.0
5    3/1/2000  10.0
6   3/31/2000  24.1
7   5/10/2000 510.0
8   5/22/2000 522.0
9   6/04/2000 604.0
10  7/03/2000  10.1
11  7/30/2000   7.2
12 12/28/2000  11.0
13 12/30/2000   3.0

> mon.returns
  Month          V1
1     1  0.01000000
2     2  0.07843137
3     3  1.41000000
4     5  0.02352941
5     6  0.00000000
6     7 -0.28712871
7    12 -0.72727273

希望有帮助。

于 2013-07-19T01:09:10.527 回答
1

这是一个非常古老的线程,但作为参考,这里有一个data.table使用与@Ram 相同的数据的解决方案:

structure(list(Date = structure(c(10957, 10987, 10988, 11015, 11017, 11047, 11087, 11099, 11112, 11141, 11168, 11319, 11321), class = "Date"), Value = c(10, 10.1, 10.2, 11, 10, 24.1, 510, 522, 604, 10.1, 7.2, 11, 3)), .Names = c("Date", "Value"), row.names = c(NA, -13L), class = c("data.table", "data.frame"), .internal.selfref = <pointer: 0x00000000001b0788>)

它本质上是一个使用该data.table::month功能的单线:

library(data.table)

setDT(df)[ , diff(Value) / Value[1], by= .(month(Date))]

相对于每个月的第一个记录日,这将产生变化。如果首选相对于最后一天的更改,则中间的表达式应更改为diff(Value) / Vale[2]

于 2016-03-11T09:14:34.533 回答
1

1)没有包试试这个:

DF <- read.table(text = Lines)

fmt <- "%m/%d/%Y"
ym <- format(as.Date(DF$V1, format = fmt), "%Y-%m")

ret <- function(x) diff(range(x))/x[1]
ag <- aggregate(V2 ~ ym, DF, ret)

给予:

> ag
       ym         V2
1 2000-01 0.01000000
2 2000-02 0.07843137

如果需要,我们可以将其转换为"ts"类。假设没有缺失月份:

ts(ag$V2, start = 2000, freq = 12)

给予:

            Jan        Feb
2000 0.01000000 0.07843137

2)如果你使用 zoo 或 xts 时间序列包会更容易一些。 fmt并且ret来自上面:

library(zoo)
z <- read.zoo(text = Lines, format = fmt)
z.ret <- aggregate(z, as.yearmon, ret)

给予:

> z.ret
  Jan 2000   Feb 2000 
0.01000000 0.07843137 

如果您已经有一个 data.frame ,那么如果第一列属于类,DF则该read.zoo语句可以替换为z <- read.zoo(DF, format = fmt)或省略arg 。format"Date"

如果"ts"需要上课,请使用as.ts(z.ret)

注:输入Lines为:

Lines <- "1/1/2000 10.00
1/31/2000 10.10
2/1/2000 10.20
2/28/2000 11.00"
于 2016-03-11T12:20:41.087 回答
1

这是另一种方法(使用 quantmod 包):

这会根据 AAPL 的每日价格计算每月回报。

*library(quantmod)     # load the quantmod package
getSymbols("AAPL")     # download daily price for stock AAPL
monthlyReturn = periodReturn(AAPL,period="monthly")
monthlyReturn2014 = periodReturn(AAPL,period="monthly",subset='2014:') # for 2014*
于 2015-07-23T23:39:42.893 回答
0

TTR 包中的 ROC 函数将执行此操作。如果您只想查看每月行为,则可以首先使用 to.monthly 或 endpoints() (从每日时间序列到 R xts 对象中的每周时间序列)。

library(TTR)
# data.monthly <- to.monthly( data, indexAt='periodEnd' ) # if OHLC data
# OR
data.monthly <- data[ endpoints(data, on="months", k=1), ]
data.roc <- ROC(data.monthly, n = 1, type = "discrete")
于 2014-11-12T10:45:58.490 回答