为了使您的示例具有可重复性,我从 Greene 的计量经济学教科书中获取了失业和 GDP 数据,这些数据在AER
软件包中提供。我还采用了 GDP 回报率而不是 GDP 水平:
data("USMacroG", package = "AER")
datam <- ts.intersect(
unemp = USMacroG[, "unemp"],
gdp = diff(log(USMacroG[, "unemp"]))
)
然后可以通过zoo
包进行滚动回归:
library("zoo")
out <- rollapplyr(datam, width = 60, by.column = FALSE,
FUN = function(x) coef(lm(as.data.frame(x))))
结果对象out
是一个时间序列对象(类"ts"
),其中仅存储了两个回归系数(截距和斜率)。
class(out)
## [1] "mts" "ts" "matrix"
head(out, 3)
## (Intercept) gdp
## [1,] 4.896035 2.104652
## [2,] 4.878405 2.307698
## [3,] 4.870110 2.397435
因此,绘制第二列会产生随时间变化的 GDP 回报斜率:
plot(out[, 2])
因此,为了获得除了系数之外的标准误差,这些都需要存储在out
时间序列中。可以通过该sandwich
软件包获得各种风格的 HAC 标准错误(安德鲁斯内核 HAC、Newey-West 等)。对于单个线性回归:
reg <- lm(as.data.frame(datam))
coef(reg)
## (Intercept) gdp
## 5.677756 2.945576
sqrt(diag(vcov(reg)))
## (Intercept) gdp
## 0.1101139 1.5414225
library("sandwich")
sqrt(diag(kernHAC(reg)))
## (Intercept) gdp
## 1.543329 2.810953
如您所见,由于数据中的正自相关(这可能更好地明确建模而不是通过 HAC 标准误差捕获),HAC 标准误差要大得多。
out <- rollapplyr(datam, width = 60, by.column = FALSE,
FUN = function(x) {
reg <- lm(as.data.frame(x))
c(
"slope" = coef(reg)[2],
"se" = sqrt(diag(vcov(reg)))[2],
"hacse" = sqrt(diag(kernHAC(reg)))[2]
)
})
这会产生估计的斜率和两种标准误差:
head(out, 3)
## slope.gdp se.gdp hacse.gdp
## [1,] 2.104652 1.482968 2.079983
## [2,] 2.307698 1.491482 2.153506
## [3,] 2.397435 1.532250 2.278149
从这里你可以创建更多的情节等。示例中的模型并不是特别适合,而且相当有问题。但我希望现在很清楚(呃)R 代码是如何工作的。