0

我在 R 中运行一个线性混合效应模型,我不确定如何在模型中包含一个不感兴趣的协变量,甚至不知道如何决定是否应该这样做。

我有两个主题内变量,我们称它们为 A 和 B,每个有两个级别,每个参与者都有很多观察结果。我对他们的交互如何在 4 个组之间变化感兴趣。我的结果是反应时间。在最简单的层面上,我有这个模型:

RT ~ 1 + A*B*Groups + (1+A | Subject ID)

我想将 Gender 添加为不感兴趣的协变量。我没有理论上的理由假设它会影响任何事情,但它在各个群体之间确实不平衡,所以我想包括它。我的问题的第一部分是:最好的方法是什么?

是不是这个型号:

RT ~ 1 + A*B*Groups + Gender + (1+A | Subject ID)

或这个:

RT ~ 1 + A*B*Groups*Gender + (1+A | Subject ID)

? 还是其他方式?我对第二个模型的担忧是它有点不合理地夸大了模型中的项数。另外,我担心过度拟合。

我的问题的第二部分:在选择最佳模型时,我应该何时添加协变量以查看它是否有任何区别?让我解释一下我的意思。

假设我从上面提到的最简单的模型开始,但没有 A 的斜率,所以:

RT ~ 1 + A*B*Groups + (1| Subject ID)

我应该先添加协变量,作为主效应(+ Gender)还是作为交互的一部分(*Gender),然后查看为 A 添加斜率是否会产生影响(通过使用 anova() 函数),或者我可以先添加斜率(理论上更重要),然后看看性别是否重要?

4

1 回答 1

1

以下是关于您的两个问题的一些建议。

  1. 我会推荐一种迭代建模策略。

    从...开始

    RT ~ 1 + A*B*Groups*Gender + (1+A | Subject ID)
    

    看看问题是否可以解决。上述模型将包括加性效应以及、和之间的所有交互项。ABGroupsGender

    如果问题难以处理,则丢弃Gender与其他协变量之间的交互项,并建模

    RT ~ 1 + A*B*Groups + Gender + (1+A | Subject ID)
    

    如果没有关于观察次数的任何细节,很难就潜在的过度拟合做出陈述。

  2. 关于你的第二个问题:一般来说,我会推荐贝叶斯方法;看看rstan基于- 的brmsR 包,它允许您使用相同的lme4/glmm公式语法,从而轻松翻译模型。模型比较和预测性能是非常宽泛的术语。有多种方法可以探索和比较这些类型的嵌套/分层贝叶斯模型的预测性能。例如,参见Piironi 和 Vehtari以及Vehtari 和 Ojanen的论文。

于 2018-04-20T11:05:40.927 回答