我有以下问题,我有一个面板数据模型,我想使用随机效应进行估计。估计正态模型时:
#random effects non spatial model
re.nonspatial = plm(observed.cases ~ Schools + Sportclubs + Public.spaces + Mouth.masks.in.schools + Mouth.masks.in.public.spaces.gyms + No.more.alcohol.after.8 + max.guests + max.gatherings + total.inhabitants + inhabitants.per.km2
, data = Policiesmatrix, model = "random", index=c("municipality.id", "Start_Date"))
#summarizing results
summary(re.nonspatial)
R 说我对变量 max.gatherings 有多重共线性问题,因为它与另一个变量高度相关,当我删除这个变量时,一切都运行良好。
但是现在问题来了,当我想用滞后的解释变量运行模型时(因此,在因变量的时间段之前的时间段的解释变量我得到了这个:
fun1 = observed.cases ~ lag(Schools, 1, shift = time) + lag(Public.spaces,1, shift = time) + lag(Sportclubs, 1, shift = time) + lag(No.more.alcohol.after.8,1, shift = time) + lag(Mouth.masks.in.public.spaces.gyms,1, shift = time) + lag(max.guests, 1, shift = time)
re.nonspatial.lag2 = plm(fun1, data = Policiesmatrix, model = "random",
index=c("municipality.id", "Start_Date"))
summary(re.nonspatial.lag2)
我得到多重共线性错误:solve.default(crossprod(ZBeta)) 中的错误:系统在计算上是奇异的
我不明白,因为我使用的是相同的数据集,所以普通数据集怎么可能没有多重共线性,但滞后,本质上是相同的数据集为所有变量减去 1 个数据点,具有多重共线性。