我正在尝试对我的研究小组中的一篇文章进行分析。
我有一个包含近 80 列的数据,其中三个是我的因变量(AgeGroup、Surface 和 Vision)。这三个变量是二进制的。
我的目标是:看看这三个变量之间是否存在相互作用。
我阅读了一些文本和文章,发现 ANOVA 类型 3 是查看这些交互的最佳方式。
但是,当我编写代码时,我不明白一件事:我尝试了一些代码,看看会发生什么。我看到了这两个代码之间的区别:
model = smf.ols("FES_1 ~ C(AgeGroup, Sum) + C(Surface, Sum) + C(Vision, Sum) + C(AgeGroup, Sum):C(Surface, Sum) + C(Surface, Sum):C(Vision, Sum) + C(AgeGroup, Sum):C(Vision, Sum) + C(AgeGroup, Sum):C(Surface, Sum):C(Vision, Sum)", data=data_semrepetir).fit()
aov_table = sm.stats.anova_lm(model, typ=3)
aov_table
model = smf.ols("FES_1 ~ C(AgeGroup) + C(Surface) + C(Vision) + C(AgeGroup):C(Surface) + C(Surface):C(Vision) + C(AgeGroup):C(Vision) + C(AgeGroup):C(Surface):C(Vision)", data=data_semrepetir).fit()
aov_table = sm.stats.anova_lm(model, typ=3)
aov_table
主要区别是,例如,C(AgeGroup) 和 C(AgeGroup,Sum)。
并且这两个代码中的值是不同的。为什么会这样?