0

我昨天发布了这个问题,但收到了一些有价值的反馈,我的帖子还有一些不足之处:)。这是一个更新的尝试,希望更清晰:

我有一个 xts 动物园对象,想使用 R 确定过去 20 个周期内斜率系数的 t 统计量,然后测试该 t 值是否 > 2。

class(prices)

[1] "xts" "zoo"

tail(prices)
             IWM    SPY    TLT
2012-10-24 81.20 141.02 121.48
2012-10-25 81.53 141.43 120.86
2012-10-26 81.14 141.35 122.64
2012-10-31 81.63 141.35 123.36
2012-11-01 82.49 142.83 122.35
2012-11-02 81.19 141.56 122.26

我无法弄清楚如何对每列与时间进行回归,因此我使用索引创建了一个新列(天数)并执行了与索引的回归:

lastprices = last(prices,20)
prices.data.frame = as.data.frame(lastprices)
daynumber = index(prices.data.frame)
pdfd = data.frame(prices.data.frame, daynumber)
pdfd.lm = lm(pdfd$daynumber ~ ., data=pdfd)
tstat = coef(summary(pdfd.lm))
tstat[,"t value"]
(Intercept)         IWM         SPY         TLT 
  4.5426630  -0.1788975  -1.3521969  -2.2362345 
tstattest = ifelse(tstat[,"t value"]>2,1,0)
tstattest
(Intercept)         IWM         SPY         TLT 
          1           0           0           0 

我不禁认为这不是完成这项任务的最有效方式。有没有人知道如何在不创建 daynumber 列的情况下对每列与时间进行回归?

谢谢 - 放轻松,我刚开始学习!

4

1 回答 1

0

我认为你原来的问题已经取得了有益的进展。我认为来自未命名包的输出格式实际上是 lm 的输出,其中公式的 hte LHS 上有多个列。我对你的第二个版本所做的是:

require(zoo)
require(xts)
prices <- read.zoo(text="dt           IWM    SPY    TLT
 2012-10-24 81.20 141.02 121.48
 2012-10-25 81.53 141.43 120.86
 2012-10-26 81.14 141.35 122.64
 2012-10-31 81.63 141.35 123.36
 2012-11-01 82.49 142.83 122.35
 2012-11-02 81.19 141.56 122.26", index=1, header=TRUE, FUN=as.Date, format="%Y-%m-%d")
 prices <- as.xts(prices)
dprice <- as.data.frame(prices)
dprice$dat <- 1:6

lm( cbind(IWM,SPY , TLT) ~dat , data=dprice)
#-------------
Call:
lm(formula = cbind(IWM, SPY, TLT) ~ dat, data = dprice)

Coefficients:
             IWM        SPY        TLT      
(Intercept)   81.19800  140.90000  121.24933
dat            0.09486    0.19714    0.25971

请注意,该输出中没有 t 值。summary.lm 函数将创建这些:

tstat = coef(summary(fit))
tstat
#--------------
Response IWM :
               Estimate Std. Error     t value     Pr(>|t|)
(Intercept) 81.19800000  0.4993259 162.6152292 8.578215e-09
dat          0.09485714  0.1282151   0.7398284 5.004726e-01

Response SPY :
               Estimate Std. Error    t value     Pr(>|t|)
(Intercept) 140.9000000  0.5356109 263.064096 1.252746e-09
dat           0.1971429  0.1375322   1.433431 2.250283e-01

Response TLT :
               Estimate Std. Error   t value     Pr(>|t|)
(Intercept) 121.2493333  0.7632198 158.86556 9.417108e-09
dat           0.2597143  0.1959767   1.32523 2.557232e-01

要从三个矩阵的列表中提取 t 值,您可以使用 lapply:

lapply( coef(summary(fit)), "[" , ,"t value")
#----------
$`Response IWM`
(Intercept)         dat 
162.6152292   0.7398284 

$`Response SPY`
(Intercept)         dat 
 263.064096    1.433431 

$`Response TLT`
(Intercept)         dat 
  158.86556     1.3252

要获得拦截,您可以使用以下命令:

 lapply( coef(summary(fit)), "[" , "(Intercept)","t value")
#-----
$`Response IWM`
[1] 162.6152

$`Response SPY`
[1] 263.0641

$`Response TLT`
[1] 158.8656

请注意,Intercept 值在这种情况下几乎没有意义。如果你使用数字 1:6,你会得到一个截距,如果你使用 Dates-classes 值,你会得到一个完全不同的值。t 检验是关于截距是否为零,并且由于比例相当随意,除非您非常确定编码以及零值意味着什么,否则它没有解释。

于 2012-11-05T05:46:19.033 回答