0

我正在尝试对我的研究小组中的一篇文章进行分析。

我有一个包含近 80 列的数据,其中三个是我的因变量(AgeGroup、Surface 和 Vision)。这三个变量是二进制的。

我的目标是:看看这三个变量之间是否存在相互作用。

我阅读了一些文本和文章,发现 ANOVA 类型 3 是查看这些交互的最佳方式。

但是,当我编写代码时,我不明白一件事:我尝试了一些代码,看看会发生什么。我看到了这两个代码之间的区别:

model = smf.ols("FES_1 ~ C(AgeGroup, Sum) + C(Surface, Sum) + C(Vision, Sum) + C(AgeGroup, Sum):C(Surface, Sum) + C(Surface, Sum):C(Vision, Sum) + C(AgeGroup, Sum):C(Vision, Sum) + C(AgeGroup, Sum):C(Surface, Sum):C(Vision, Sum)", data=data_semrepetir).fit()
aov_table = sm.stats.anova_lm(model, typ=3)
aov_table

model = smf.ols("FES_1 ~ C(AgeGroup) + C(Surface) + C(Vision) + C(AgeGroup):C(Surface) + C(Surface):C(Vision) + C(AgeGroup):C(Vision) + C(AgeGroup):C(Surface):C(Vision)", data=data_semrepetir).fit()    
aov_table = sm.stats.anova_lm(model, typ=3)
aov_table

主要区别是,例如,C(AgeGroup) 和 C(AgeGroup,Sum)。

并且这两个代码中的值是不同的。为什么会这样?

并出现一个术语“拦截”,这个术语代表什么? 在此处输入图像描述 在此处输入图像描述

4

0 回答 0