我在 R 中使用 library(mlogit) 并且我被困在这个看起来像这样的特定数据集
CustomerID Item Price Calories Choice
1 200 1.99 490 NO
1 312 4.99 887 NO
1 560 5.19 910 NO
1 700 4.79 690 NO
1 909 4.89 660 NO
1 1705 4.00 840 NO
总共有 187 个项目和 4 个 customerID(1、2、3 和 4)。每位顾客都会看到一组 187 种商品,他会根据价格和卡路里从中选择一种。4 位顾客的价格和卡路里保持不变。
> str(data)
'data.frame': 748 obs. of 5 variables:
$ CustomerID: int 1 1 1 1 1 1 1 1 1 1 ...
$ Item : Factor w/ 187 levels "200","231","232",..: 1 11 14 15 18 25 33 34 36 39 ...
$ Price : num 1.99 4.99 5.19 4.79 4.89 4 4 4 4 6.21 ...
$ Calories : int 490 887 910 690 660 840 1638 1559 1530 1559 ...
$ Choice : Factor w/ 2 levels "NO ","YES": 1 1 1 1 1 1 1 1 1 1 ...
我按照以下方式根据 mlogit 命令格式化数据:-
m<- mlogit.data(data, choice="Choice", shape="long", alt.levels=c("200", "231", "232", "240",.....(*all the 187 'Item' here)*))
这给了我这个: -
head(m)
CustomerID Item Price Calories Choice
1.200 1 200 1.99 490 NO
1.231 1 231 1.19 320 YES
1.232 1 232 1.49 320 NO
1.240 1 240 4.79 590 NO
1.250 1 250 2.39 490 NO
1.253 1 253 4.49 691 NO
我的数据集按 CutomerID 和 Item 排序,正如我在上一个问题中读到的那样,它可能会导致问题。
我尝试了几个公式,但没有一个运行
Tr.ml <- mlogit(Choice ~0|Price+Calories|0,m)
Error in solve.default(H, g[!fixed]) :
Lapack routine dgesv: system is exactly singular: U[548,548] = 0
In addition: There were 50 or more warnings (use warnings() to see the first 50)
价格和卡路里之间的相关性约为 43%
cor(m$Price,m$Calories)
[1] 0.429796
我也试过这个: -
Tr.ml <- mlogit(Choice ~Price+Calories,m)
Error in solve.default(H, g[!fixed]) :
system is computationally singular: reciprocal condition number = 1.06243e-23
In addition: There were 50 or more warnings (use warnings() to see the first 50)
谁能提供一些解决此错误的想法?我已经做了 2 周了。