我正在运行逻辑回归,我想控制受访者所在的国家/地区。我有 12 个国家。我使用“fastDummy”包为每个国家/地区创建假人 ALL<-dummy_cols(ALL, select_columns = "country") 我得到如下信息: country_Japan 1 1 0 0 0 0 country_Taiwan 0 0 1 1 0 0 country_China 0 0 0 0 1 1
等等...正如你所看到的,所有变量的总和构成了完美的共线性。因此,我无法估计模型。我读到我需要包含一个带有 0 的变量作为最后一个国家虚拟变量以避免这种共线性。这个对吗?我包括了截距(带有 1 的列),但它没有帮助。我会很感激你的建议。谢谢
问问题
39 次