我有一个用 scikit-learn 训练的 SGDClassifier 模型。我提取特征名称.get_feature_names()
和系数.coef_
我将 2 列组合在一个数据框中,如下所示:
feature value
hiroshima 3.918584
wildfire 3.287680
earthquake 3.256817
massacre 3.186762
storm 3.124809
... ...
job -1.696438
song -1.736640
as -1.956571
nowplaying -2.028240
write -2.263968
我想知道如何解释特征重要性?正的高值是什么意思?低负值是什么意思?