0

我有一个多项式逻辑回归,结果变量有 6 个级别:10、20、60、70、80、90

test<-multinom(y ~ x1 + x2 +  as.factor(x3) ,data=data1)

我想预测每组给定输入值与 y 的每个级别相关联的概率。所以我运行这个:

 dfin <- data.frame( ses = c(10,20,60,70,80,90), x1=2.1, x2=4, x3=40)
 predict(test, todaydata = dfin, type = "probs")

但是我没有得到 6 个概率(每个级别的结果一个),而是得到了很多行的概率。每行有 6 个概率(总和为 1),但我不知道为什么我会得到很多行以及我应该信任哪一行。

5541   7.226948e-01 1.498199e-01 8.086624e-02 1.253289e-02 8.799416e-03 2.528670e-02
5546   6.034188e-01 7.386553e-02 1.908132e-01 1.229962e-01 4.716406e-04 8.434623e-03
5548   7.266859e-01 1.278779e-01 1.001634e-01 2.032530e-02 7.156766e-03 1.779076e-02
5562   7.120179e-01 1.471181e-01 9.146071e-02 1.265592e-02 8.189511e-03 2.855781e-02
5666   6.645056e-01 3.034978e-02 1.687687e-01 1.219601e-01 3.972833e-03 1.044308e-02
5668   4.875966e-01 3.126855e-02 2.090006e-01 2.430828e-01 3.721631e-03 2.532970e-02
5670   3.900772e-01 1.305786e-02 1.803779e-01 4.137106e-01 1.314298e-03 1.462155e-03
5671   4.272971e-01 1.194599e-02 1.748494e-01 3.833422e-01 8.863019e-04 1.678975e-03
5674   5.477521e-01 2.587478e-02 1.650817e-01 2.487404e-01 3.368726e-03 9.182195e-03
5677   4.300207e-01 9.532836e-03 1.608679e-01 3.946310e-01 2.626104e-03 2.321351e-03
5678   4.542981e-01 1.220728e-02 1.410984e-01 3.885146e-01 2.670689e-03 1.210891e-03
5705   5.642322e-01 1.830575e-01 5.134181e-02 8.952808e-04 8.796467e-03 1.916767e-01
5706   6.161694e-01 1.094046e-01 1.979044e-01 1.095385e-02 7.254592e-03 5.831323e-02
....

我在编码中遗漏了什么还是需要设置任何参数?

4

1 回答 1

2

它返回观察值在每个类别中的概率。这就是多项逻辑回归的实现方式。您可以想象一系列二项式逻辑回归(每个类别一个),然后选择概率最高的类别。这被称为一对一的方法。

在您的示例中,观察 5541 被预测为 1 类,因为第一列具有最高值(概率)。观察 5670 是第 4 类,因为那是概率最高的列。矩阵将具有维度 # of observations x # of classes

于 2014-04-21T09:47:43.020 回答