6

我想知道在 Sklearn 中安装 MLP 分类器后是否有任何方法可以可视化或找到最重要/最有贡献的特征。

简单的例子:

import pandas as pd
import numpy as np
from sklearn.preprocessing import StandardScaler
from sklearn.model_selection import LeaveOneOut
from sklearn.neural_network import MLPClassifier
from sklearn.model_selection import GridSearchCV
from sklearn.pipeline import make_pipeline


data= pd.read_csv('All.csv', header=None)
X, y = data.iloc[0:, 0:249].values, data.iloc[0:,249].values

sc = StandardScaler()
mlc = MLPClassifier(activation = 'relu', random_state=1,nesterovs_momentum=True)
loo = LeaveOneOut()
pipe = make_pipeline(sc, mlc)

parameters = {"mlpclassifier__hidden_layer_sizes":[(168,),(126,),(498,),(166,)],"mlpclassifier__solver" : ('sgd','adam'), "mlpclassifier__alpha": [0.001,0.0001],"mlpclassifier__learning_rate_init":[0.005,0.001] }
clf = GridSearchCV(pipe, parameters,n_jobs= -1,cv = loo)
clf.fit(X, y)

model = clf.best_estimator_
print("the best model and parameters are the following: {} ".format(model))
4

1 回答 1

7

好问题。NN 模型缺乏可解释性是 ML/NN 社区一直在努力解决的问题。

最近受到关注的一种方法是LIME 论文(Ribeiro 等人,KDD'16)。以下是摘要的相关摘录:

  • “在这项工作中,我们提出了 LIME,这是一种新颖的解释技术,通过在预测周围学习可解释的模型,以可解释和忠实的方式解释任何分类器的预测”

还有一个 GitHub存储库(Python,耶!)。

(如果您确实尝试了 LIME,请在问题评论中分享您的经验..)

于 2017-06-10T07:06:28.230 回答