我有一个基于每两年进行一次的全国调查的 df;时间段是 2010-14,我过滤了 df,以便只有出现至少两次的人。这样,我有一个面板 df 但不平衡。
我进行回归以研究哪些变量会影响补充养老金的参与(在我的国家是自愿的)。我运行了一个单边固定效应回归,现在我想运行一个双边固定效应回归(个人和时间)。
个体变量是uid,时间变量是year。我在 r 中使用了 plm 包:
df.p <- plm.data(df, c("uid", "year")
并运行回归:
reg1 <- plm(pens ~ woman + age + I(age^2/100) + high + medium + nord + centre, model="within", effect="twoways", data=df.p)
其中高中和高中是关于教育水平的假人,而nord和center是关于地理位置的。为简单起见,我省略了原始模型中存在的其他变量(20 个变量)。
至少工作 1 小时后,我运行摘要命令:
summary(reg1)
又工作一个小时后,我得到了错误:
Error in crossprod(t(X), beta) : non-conformable arguments
所以我认为存在多重共线性问题。所以我用相关矩阵检查多重共线性:
p1 <- with(df, data.frame(woman=woman, age=age, high=high, medium=medium, nord=nord, centre=centre))
round(cor(p1),3)
考虑到我使用所有变量创建了矩阵(为了简单起见,这里省略了,正如我所写的)。我没有找到任何相关的价值。我还检查了方差膨胀因子:
vif(p1)
我得到了:
No variable from the 20 input variables has collinearity problem.
在这一点上,我认为共线性问题可以由我运行两侧回归但我不知道如何管理问题的事实来确定。
提前致谢。