我正在尝试使用 R 中的 mlogit 包运行多项逻辑回归。我已在此处上传数据https://drive.google.com/file/d/0B_o3xTWAYdbuRGw0dzNFRzd2NEk/view?usp=sharing。
数据包含两个不同的选择变量,我想在它们上运行相同的模型。我像这样运行第一个模型:
lfsm1 <- mlogit.data(lfs.models, shape="wide", choice="PWK")
f1 <- mFormula(PWK~1 | MIGGRP+SEX+AGE+EDU)
m1 <- mlogit(f1, lfsm1, weights=PWT14)
summary(m1)
该模型运行没有问题。然后我在另一个选择变量上运行相同的模型:
lfsm2 <- mlogit.data(lfs.models, shape="wide", choice="multi")
f2 <- mFormula(multi~1 | MIGGRP+SEX+AGE+EDU)
m2 <- mlogit(f1, lfsm2, weights=PWT14)
我收到以下错误:
Error in if (is.null(initial.value) || lnl <= initial.value) break :
missing value where TRUE/FALSE needed
In addition: There were 20 warnings (use warnings() to see them)
> warnings()
Warning messages:
1: In `[<-.factor`(`*tmp*`, is.na(x), value = FALSE) :
invalid factor level, NA generated
并且该警告消息重复 20 次。
我不确定这些错误中的任何一个在我的模型中意味着什么。上一篇文章(mlogit:需要 TRUE/FALSE 的缺失值)表明我的第一个错误发生是因为我的数据不是宽格式,或者因为有些人没有选择任何替代方案。就我而言,这些解释都不是正确的。我所看到的警告消息表明 mlogit 对变量是因子或数字的反应很糟糕。但我不太明白为什么这在多项回归环境中很重要,或者问题如何在如此大的数据集中只发生了 20 次。
任何建议将不胜感激!