0

我正在运行逻辑回归,我想控制受访者所在的国家/地区。我有 12 个国家。我使用“fastDummy”包为每个国家/地区创建假人 ALL<-dummy_cols(ALL, select_columns = "country") 我得到如下信息: country_Japan 1 1 0 0 0 0 country_Taiwan 0 0 1 1 0 0 country_China 0 0 0 0 1 1
等等...正如你所看到的,所有变量的总和构成了完美的共线性。因此,我无法估计模型。我读到我需要包含一个带有 0 的变量作为最后一个国家虚拟变量以避免这种共线性。这个对吗?我包括了截距(带有 1 的列),但它没有帮助。我会很感激你的建议。谢谢

4

1 回答 1

0

检查函数remove_first_dummy中的参数dummy_cols,即设置为TRUE。这应该可以解决您的多重共线性问题。

于 2021-10-09T11:02:31.477 回答