我有一个数据集,其中包含一个因变量 y,以及两个独立的 x(连续)和 z(0 或 1 的指标)。我想要适合的模型是
y = a*1(z==0) + b*x*1(z==1),
换句话说,如果 z==0 那么估计应该只是截距,否则估计应该是截距加上 b*x 部分。
我想出的唯一方法是分两步进行,即首先取 z==0 的 y 的平均值(这是截距的估计值),然后从其余的 ys 中减去这个值并运行一个简单的回归来估计斜率。
我(几乎)确定这会起作用,但理想情况下,我想使用 lm 或类似的东西在 R 中的单行中获得估计值。有没有办法做到这一点?提前感谢!