0

我正在尝试使用 python statsmodels 包执行分位数回归。

我有 5 个预测变量和 6 个虚拟变量,应该用于预测变量 FF159。

问题是当我不使用其中一个虚拟变量和我的预测变量时,该模型工作得非常好。但是当使用所有 5 个预测变量和 6 个虚拟变量时,它会在标题中引发错误。

c1,c2,c3,c4,c5 和 c6 是我的虚拟变量。

此代码返回以下结果:(我只使用了 6 个虚拟变量中的 5 个)

cv= pd.read_excel(directory2+'subset_data_after_FS_FF159.xlsx',  sheet_name = "Sheet1",index=False)
cv = cv.rename(columns={'1': 'c1', '2': 'c2','3': 'c3','4': 'c4','5': 'c5','6': 'c6'})
mod = smf.quantreg('FF159 ~ BO21+BO24+RE40+LA30+HORAIRE+c1+c2+c3+c4+c6', cv)
res = mod.fit(q=.7)
print(res.summary())

结果:

在此处输入图像描述

在预测变量旁边使用 6 个虚拟变量,python 向我抛出了这个错误:

在此处输入图像描述

我在一些线程中看到它可能是多重共线性问题,但事实并非如此。下图显示了我的相关矩阵。

在此处输入图像描述

4

0 回答 0