问题:我需要估计一组多项逻辑多级模型,但找不到合适的 R 包。估计此类模型的最佳 R 包是什么?STATA 13 最近将此功能添加到他们的多级混合效应模型中——因此估计此类模型的技术似乎是可用的。
细节:许多研究问题需要估计结果变量是分类的多项逻辑回归模型。例如,生物学家可能有兴趣调查哪种树木(例如松树、枫树、橡树)受酸雨的影响最大。市场研究人员可能会对客户年龄与在 Target、Safeway 或 Walmart 购物的频率之间是否存在关系感兴趣。这些案例的共同点是结果变量是分类的(无序的),多项逻辑回归是首选的估计方法。就我而言,我正在调查人类迁移类型的差异,结果变量 (mig) 编码为 0=未迁移,1=内部迁移,2=国际迁移。这是我的数据集的简化版本:
migDat=data.frame(hhID=1:21,mig=rep(0:2,times=7),age=ceiling(runif(21,15,90)),stateID=rep(letters[1:3],each=7),pollution=rep(c("high","low","moderate"),each=7),stringsAsFactors=F)
hhID mig age stateID pollution
1 1 0 47 a high
2 2 1 53 a high
3 3 2 17 a high
4 4 0 73 a high
5 5 1 24 a high
6 6 2 80 a high
7 7 0 18 a high
8 8 1 33 b low
9 9 2 90 b low
10 10 0 49 b low
11 11 1 42 b low
12 12 2 44 b low
13 13 0 82 b low
14 14 1 70 b low
15 15 2 71 c moderate
16 16 0 18 c moderate
17 17 1 18 c moderate
18 18 2 39 c moderate
19 19 0 35 c moderate
20 20 1 74 c moderate
21 21 2 86 c moderate
我的目标是估计年龄(自变量)对(1)内部迁移与不迁移,(2)国际迁移与不迁移,(3)内部迁移与国际迁移的几率的影响。另一个复杂因素是我的数据在不同的聚合级别上运行(例如,污染在州一级运行),我也有兴趣预测空气污染(污染)对开展特定类型运动的几率的影响。
笨拙的解决方案:可以通过将每个模型的数据集减少到只有两种迁移类型来估计一组单独的逻辑回归模型(例如,模型 1:只有案例编码 mig=0 和 mig=1;模型 2:只有案例编码 mig=0 和mig=2;模型 3:仅编码为 mig=1 和 mig=2) 的情况。这种简单的多级逻辑回归模型可以用 lme4 进行估计,但这种方法不太理想,因为它没有适当地考虑省略案例的影响。第二种解决方案是使用 R2MLwiN 包在 MLWiN 中通过 R 运行多项逻辑多级模型。但由于 MLWiN 不是开源的并且生成的对象难以使用,我宁愿避免使用此选项。根据全面的互联网搜索,似乎对此类模型有一些需求,但我不知道有一个好的 R 包。因此,如果一些运行过此类模型的专家可以提供建议,并且如果有多个包可能表明一些优点/缺点,那就太好了。我确信这些信息对于多个 R 用户来说将是一个非常有用的资源。谢谢!!
最好的,拉斐尔