2

我在 R 中使用 library(mlogit) 并且我被困在这个看起来像这样的特定数据集

 CustomerID Item Price Calories Choice
           1  200  1.99      490    NO 
           1  312  4.99      887    NO 
           1  560  5.19      910    NO 
           1  700  4.79      690    NO 
           1  909  4.89      660    NO 
           1 1705  4.00      840    NO 

总共有 187 个项目和 4 个 customerID(1、2、3 和 4)。每位顾客都会看到一组 187 种商品,他会根据价格和卡路里从中选择一种。4 位顾客的价格和卡路里保持不变。

> str(data)
'data.frame':   748 obs. of  5 variables:
 $ CustomerID: int  1 1 1 1 1 1 1 1 1 1 ...
 $ Item      : Factor w/ 187 levels "200","231","232",..: 1 11 14 15 18 25 33 34 36 39 ...
 $ Price     : num  1.99 4.99 5.19 4.79 4.89 4 4 4 4 6.21 ...
 $ Calories  : int  490 887 910 690 660 840 1638 1559 1530 1559 ...
 $ Choice    : Factor w/ 2 levels "NO ","YES": 1 1 1 1 1 1 1 1 1 1 ...

我按照以下方式根据 mlogit 命令格式化数据:-

m<- mlogit.data(data, choice="Choice", shape="long", alt.levels=c("200",    "231",    "232",    "240",.....(*all the 187 'Item' here)*))

这给了我这个: -

head(m)
      CustomerID Item Price Calories Choice
1.200          1  200  1.99      490    NO 
1.231          1  231  1.19      320    YES
1.232          1  232  1.49      320    NO 
1.240          1  240  4.79      590    NO 
1.250          1  250  2.39      490    NO 
1.253          1  253  4.49      691    NO 

我的数据集按 CutomerID 和 Item 排序,正如我在上一个问题中读到的那样,它可能会导致问题。

我尝试了几个公式,但没有一个运行

Tr.ml <- mlogit(Choice ~0|Price+Calories|0,m)
Error in solve.default(H, g[!fixed]) : 
  Lapack routine dgesv: system is exactly singular: U[548,548] = 0
In addition: There were 50 or more warnings (use warnings() to see the first 50)

价格和卡路里之间的相关性约为 43%

cor(m$Price,m$Calories)
[1] 0.429796

我也试过这个: -

Tr.ml <- mlogit(Choice ~Price+Calories,m)
Error in solve.default(H, g[!fixed]) : 
  system is computationally singular: reciprocal condition number = 1.06243e-23
In addition: There were 50 or more warnings (use warnings() to see the first 50)

谁能提供一些解决此错误的想法?我已经做了 2 周了。

4

0 回答 0