1

我正在尝试使用 R 中的 mlogit 包运行多项逻辑回归。我已在此处上传数据https://drive.google.com/file/d/0B_o3xTWAYdbuRGw0dzNFRzd2NEk/view?usp=sharing

数据包含两个不同的选择变量,我想在它们上运行相同的模型。我像这样运行第一个模型:

lfsm1 <- mlogit.data(lfs.models, shape="wide", choice="PWK")
f1 <- mFormula(PWK~1 | MIGGRP+SEX+AGE+EDU)
m1 <- mlogit(f1, lfsm1, weights=PWT14)
summary(m1)

该模型运行没有问题。然后我在另一个选择变量上运行相同的模型:

lfsm2 <- mlogit.data(lfs.models, shape="wide", choice="multi")
f2 <- mFormula(multi~1 | MIGGRP+SEX+AGE+EDU)
m2 <- mlogit(f1, lfsm2, weights=PWT14)

我收到以下错误:

Error in if (is.null(initial.value) || lnl <= initial.value) break : 
missing value where TRUE/FALSE needed
In addition: There were 20 warnings (use warnings() to see them)
> warnings()
Warning messages:
1: In `[<-.factor`(`*tmp*`, is.na(x), value = FALSE) :
   invalid factor level, NA generated

并且该警告消息重复 20 次。

我不确定这些错误中的任何一个在我的模型中意味着什么。上一篇文章(mlogit:需要 TRUE/FALSE 的缺失值)表明我的第一个错误发生是因为我的数据不是宽格式,或者因为有些人没有选择任何替代方案。就我而言,这些解释都不是正确的。我所看到的警告消息表明 mlogit 对变量是因子或数字的反应很糟糕。但我不太明白为什么这在多项回归环境中很重要,或者问题如何在如此大的数据集中只发生了 20 次。

任何建议将不胜感激!

4

1 回答 1

0

尝试

m2 <- mlogit(f2, lfsm2, weights=PWT14)

注意调用中的f2mlogit

在您第二次调用 时mlogit.data,您已指定这multi是选择变量,并且相应地准备了数据。然而,在您使用的公式f1中,因变量被指定为PWK,因此mlogit期望一个数据框,每个备选方案都有一行,由 定义PMK,而不是multi

于 2017-08-13T19:05:03.527 回答