3

我正在sklearn.linear_model.LogisticRegression处理一个多类问题。据我了解,coef_属性的输出是每个类的每个特征的系数。我不明白的是sklearn中的解释。例如,在 SPSS 中,您将一个类作为基础,然后解释与该类相关的几率,因此您实际上会得到 n-1 个类的系数。在 sklearn 中情况并非如此,我在其中获取每个类的系数。

一个特征(四个类别)的示例指数系数是:

1.1649 | 1.0660 | 0.9589 | 0.8607

这种解释是否正确:随着该特征的一个单位值增加,该实例属于第一类的概率增加约 16%,然后在第二类增加约 7%,第三和第四类的概率减少?

另外,如何计算系数的 p 值?

4

0 回答 0