我有一个数据集,其中每个人都属于一个特定的群体,在多个离散结果之间反复选择。
subID group choice
1 Big A
1 Big B
2 Small B
2 Small B
2 Small C
3 Big A
3 Big B
. . .
. . .
我想测试组成员身份如何影响选择,并想解释由于同一个人做出的重复选择而导致的观察的非独立性。反过来,我计划实现一个混合多项式回归,将组作为固定效应,将 subID 作为随机效应。在 R 中似乎有一些多项式 logits 选项,我希望得到一些指导,这对于这个混合模型来说可能最容易实现:
1) multinom - GLM,通过 nnet,允许使用 multinom 函数。对于固定效应模型,这似乎是一个不错、清晰、直接的选择。但是,有没有办法用 multinom 实现随机效应? 之前的 CV 帖子表明 multinom 能够处理具有泊松分布和对数链接的混合效应 GLM。但是,我不明白(a)为什么会这样或(b)所需的语法。谁能澄清一下?
2) mlogit - 一个很棒的包,带有非常有用的小插曲。但是,“混合 logit”文档是指具有与替代特定协变量相关的随机效应的模型(通过rpar
参数实现)。我的模型没有替代的特定变量;我只是想说明参与者的随机截取。这可能与 mlogit 吗?是否通过将 subID 设置为使用 mlogit.data 将数据整形为长格式时自动考虑了这种id.var
差异?编辑:我刚刚找到了一个“欺骗”mlogit 的例子,它为因人而异的变量提供随机系数(非常底部),但我不太了解所涉及的语法。
3) MCMCglmm显然是另一种选择。但是,作为 R 的相对新手和完全不熟悉贝叶斯统计的人,我个人不习惯用这个包解析混合 logits 的示例语法,或者,即使遵循语法,对先验或其他需要的参数进行猜测。
对于最直接的方法及其语法实现的任何指导将不胜感激。我还想知道 subID 的随机效应是否需要嵌套在组内(因为个人是组的成员),但这可能是 CV 的问题。无论如何,非常感谢您的任何见解。