我正在尝试使用 R 中的广义矩量法来训练回归模型。我有 3 个内生回归量,它们与我知道是外生的 6 个事物相关。
- 我的结果变量是 y
- 我有 3 个内生回归变量:z1、z2、z1*z2
- 我有 6 个外源工具:x1、x2、x3、x4、x5、x6
为了进行培训,我将数据设置在 data.matrix 中dat
。第一列为 y,第二列为全 1,第三至第八列为仪器 x1-x6。第 9 到第 11 列是回归量(z1、z2 和 z1*z2)。
然后我将我的时刻条件设置如下:
moments <- function(theta, data) {
y <- as.numeric(data[, 1])
x <- data.matrix(data[, c(2,3:8)])
z <- data.matrix(data[, c(2,9,10,11)])
m <- x * as.vector((y - z %*% theta))
return(cbind(m))
}
然后我尝试训练我的模型:
gmm_model <- gmm(
g = moments,
x = dat,
t0 = (lm(y ~ z1 + z2 + z1:z2,
data=dat))$coefficients
)
当我运行它时,我得到一个错误:
model order: 1 singularities in the computation of the projection matrix results are only valid up to model order 0Error in AA %*% t(X) : requires numeric/complex matrix/vector arguments
该误差表明 x 的秩不够大,无法估计与 z 对应的变量的系数。
但是当我检查Matrix::rankMatrix(dat[,3:8])
告诉我我的 x 有 5 级并Matrix::rankMatrix(dat[2,9,10,11])
告诉我我的 z 有 4 级时。此外,rankMatrix(t(x) %*% z )
产生 4。这些值对我来说似乎对 GMM 很好。我究竟做错了什么?
我也尝试使用pgmm
from plm
,但我的数据实际上只是一个横截面(不是面板数据集),当我尝试使用它时,我因为每个人有多个观察结果而出错。
dat
好像:
y i x1 x2 x3 x4 x5 x6 z1 z2 z1*z2
[1,] 0 1 31 0 123 0.12 123456 1234567 0 0.2954545 0
[2,] 0 1 44 0 123 0.12 123456 1234567 0 0.1555556 0
[3,] 0 1 31 0 123 0.12 123456 1234567 0 0.2325581 0
[4,] 0 1 47 0 123 0.12 123456 1234567 0 0.2537313 0
[5,] 0 1 33 0 123 0.12 123456 1234567 0 0.1500000 0
[6,] 0 1 49 0 123 0.12 123456 1234567 0 0.2553191 0
x1 是 [30-100] 中的整数 x2 是二进制 0,1 x3 取两个值 x4 取两个值 x5 取两个值 x6 取两个值
z1 是二进制 0,1 z2 在 [0,1] 中是连续的