我在MagicStat上运行线性回归,并且已经到了需要在应用线性回归时检查变量的多重共线性的地步。
我正在使用我最初从这里获得的diamonds 数据集。
在分析中,我的目的是使用三个分类(序数)和一个连续作为自变量和价格作为因变量来确定预测钻石价格的因素。
切
Describe cut quality of the diamond. Quality in increasing order Fair, Good, Very Good, Premium, Ideal
颜色
Color of the diamond, with D being the best and J the worst (D, E, F, G, H, I, J)
明晰
How obvious inclusions are within the diamond:(in order from best to worst, FL = flawless, I3= level 3 inclusions) FL, IF, VVS1, VVS2, VS1, VS2, SI1, SI2, I1, I2, I3
请注意,在数据集中,清晰度列上没有具有 FL、I2 和 I3 值的数据。
克拉
Carat weight of the diamond
我还重新编码了数据集,以备不时之需。
所以,我的问题是:在这个分析中,有 3 个分类变量(序数)和一个连续变量,我们如何获得这些变量之间的多重共线性?