我在 R 中运行一个线性混合效应模型,我不确定如何在模型中包含一个不感兴趣的协变量,甚至不知道如何决定是否应该这样做。
我有两个主题内变量,我们称它们为 A 和 B,每个有两个级别,每个参与者都有很多观察结果。我对他们的交互如何在 4 个组之间变化感兴趣。我的结果是反应时间。在最简单的层面上,我有这个模型:
RT ~ 1 + A*B*Groups + (1+A | Subject ID)
我想将 Gender 添加为不感兴趣的协变量。我没有理论上的理由假设它会影响任何事情,但它在各个群体之间确实不平衡,所以我想包括它。我的问题的第一部分是:最好的方法是什么?
是不是这个型号:
RT ~ 1 + A*B*Groups + Gender + (1+A | Subject ID)
或这个:
RT ~ 1 + A*B*Groups*Gender + (1+A | Subject ID)
? 还是其他方式?我对第二个模型的担忧是它有点不合理地夸大了模型中的项数。另外,我担心过度拟合。
我的问题的第二部分:在选择最佳模型时,我应该何时添加协变量以查看它是否有任何区别?让我解释一下我的意思。
假设我从上面提到的最简单的模型开始,但没有 A 的斜率,所以:
RT ~ 1 + A*B*Groups + (1| Subject ID)
我应该先添加协变量,作为主效应(+ Gender)还是作为交互的一部分(*Gender),然后查看为 A 添加斜率是否会产生影响(通过使用 anova() 函数),或者我可以先添加斜率(理论上更重要),然后看看性别是否重要?