我有一些数据,有多个分类元素。
我想使用回归对它们进行建模,为了方便起见,使用与 statsmodels 一起使用的 patsy 公式。
当仅使用一个分类变量时,如公式中所示'C(Weekday, Treatment) - 1'
,它按预期工作,删除截距并在每个类别的设计矩阵中留下一列。
但是,当使用 2 个不同的分类变量时,例如'C(Status, Treatment) + C(Weekday, Treatment) - 1'
,则结果矩阵确实没有截距,而且“工作日”的值之一也丢失了,好像我没有-1
'd。
是否有一些我没有看到的统计原因?去除截距不足以阻止完美的共线性吗?谢谢