1

我有一个由 2015 年的日内交易数据组成的 xts 时间序列对象。我想添加一个虚拟变量,将 1 表示为事件日或将 0 表示为非事件日。

由于虚拟变量本质上不是时间序列,我是否可以将其添加到我的交易数据中?

我应该如何构建虚拟列?

如何将其添加到现有的 xts 中?

R新手,所以请在你的回答中尽可能具体。谢谢!

4

1 回答 1

2

xts基于zoo,动物园常见问题解答(问题 4)有关于不同数据类型的这一行:

“动物园”对象可以是 (1) 数值向量、(2) 数值矩阵或 (3) 因子,但不能同时包含数值向量和因子。

所以只要你的 0 和 1 是numeric,不是factor,你应该没问题。它不是一种非常高效的存储介质,但存储效率可能不是您的瓶颈。

一个例子:

timestamp <- seq.POSIXt(from=as.POSIXct("2016-10-12 09:00"), 
                    to=as.POSIXct("2016-10-13 09:00"), 
                    by="min")
dat <- rnorm(length(timestamp))
foo <- xts(dat,order.by=timestamp)

现在该指标变量:

#make this example reproducible:
set.seed(123)

dummy2 <- sample(c("event","non-event"), size=length(timestamp),
    replace=TRUE)
foo2 <- xts(dummy2, order.by=timestamp)
merged <- cbind(foo, foo2)

这警告你:

In merge.xts(..., all = all, fill = fill, suffixes = suffixes) :
  NAs introduced by coercion

的确:

summary(merged)
     Index                          ..1                ..2      
 Min.   :2016-10-12 09:00:00   Min.   :-3.38110   Min.   : NA   
 1st Qu.:2016-10-12 15:00:00   1st Qu.:-0.64010   1st Qu.: NA   
 Median :2016-10-12 21:00:00   Median : 0.04047   Median : NA   
 Mean   :2016-10-12 21:00:00   Mean   : 0.03025   Mean   :NaN   
 3rd Qu.:2016-10-13 03:00:00   3rd Qu.: 0.67461   3rd Qu.: NA   
 Max.   :2016-10-13 09:00:00   Max.   : 3.25034   Max.   : NA   
                                                  NA's   :1441  

但如果是数字:

dummy3 <- sample(0:1, size=length(timestamp), replace=TRUE)
foo3 <- xts(dummy3, order.by=timestamp)
merged <- cbind(foo, foo3)

默默返回(没有消息就是好消息)。我们来看一下:

summary(merged)

         Index                          ..1                ..2        
 Min.   :2016-10-12 09:00:00   Min.   :-3.38110   Min.   :0.0000  
 1st Qu.:2016-10-12 15:00:00   1st Qu.:-0.64010   1st Qu.:0.0000  
 Median :2016-10-12 21:00:00   Median : 0.04047   Median :0.0000  
 Mean   :2016-10-12 21:00:00   Mean   : 0.03025   Mean   :0.4983  
 3rd Qu.:2016-10-13 03:00:00   3rd Qu.: 0.67461   3rd Qu.:1.0000  
 Max.   :2016-10-13 09:00:00   Max.   : 3.25034   Max.   :1.0000  

由于第 2 列是数字,我们不使用相等性进行比较;如果这对您来说不直观,请查看R Inferno的 Circle One (注意:PDF)。

summary(merged[merged[,2] > 0.5 ,1] )
summary(merged[merged[,2] < 0.5 ,1] )

可能有一种更优雅的方式来做到这一点,但它会让你开始。

如果您打算使用xts更多内容,我推荐以下作者的建议xts

xts 对象的核心是同名包中的 zoo 对象。...动物园对象周围的大多数细节同样适用于 xts。由于简单地复述出色的介绍性动物园小插曲是多余的,因此建议读者阅读、吸收并重新阅读该文档,以最好地了解该课程的力量。

于 2016-10-17T00:51:31.770 回答