这是来自Stata在线教程的引用:如果您想将连续变量与因子变量进行交互,只需在连续变量前面加上c即可。 http://www.stata.com/capabilities/overview/factor-variables/
他们举了下面的例子:smoker#c.bmi
.
smoker
是一个分类变量,编码为 1 个不吸烟者、2 个吸烟者、3 个重度吸烟者。
bmi
是一个连续变量,体重指数。
当他们创建交互项smoker#c.bmi
时,它显示了什么以及如何解释?
这是来自Stata在线教程的引用:如果您想将连续变量与因子变量进行交互,只需在连续变量前面加上c即可。 http://www.stata.com/capabilities/overview/factor-variables/
他们举了下面的例子:smoker#c.bmi
.
smoker
是一个分类变量,编码为 1 个不吸烟者、2 个吸烟者、3 个重度吸烟者。
bmi
是一个连续变量,体重指数。
当他们创建交互项smoker#c.bmi
时,它显示了什么以及如何解释?
在我看来,这smoker
是一个虚拟变量(1/0)[请参阅下面的注释]。请仔细检查以下句子:
我们对年龄组的全因子以及人是否吸烟以及连续体重指数 (bmi) 及其与人是否吸烟的相互作用进行了线性回归[强调]
cholesterol = -0.517 smoker + 0.03455 bmi + 0.0245 bmi*smoker + other parts
on 的系数bmi
表示bmi
对非吸烟者的影响,而 on 的系数bmi*smoker
给出了对吸烟者的增量影响bmi
(即,对于吸烟者,它是 0.03455 + 0.0245,而对于非吸烟者,它是 0.03455)。交互项的重要性表明吸烟者对胆固醇的影响bmi
高于非吸烟者。
注意:有三类年龄组,而不是三类吸烟者。