我是数据科学的初学者,这是我的第一个项目。所以我想做的很简单,就是一个0-1的分类。
X= ['neighbourhood_code','room_type_code','price','minimum_nights','calculated_host_listings_count','score']
y=['pop_index']
X_train, X_test, y_train, y_test=train_test_split(
df[X], df[y],random_state=3)
rf=RandomForestClassifier(n_estimators=500, oob_score=True, random_state=666, n_jobs=-1,max_depth=10)
rf.fit(X_train,y_train.values.ravel())
result2=rf.predict(X_test)
score2=accuracy_score(result2,y_test)
import matplotlib as plt
plt.rc('font',family='SimHei',size=13)
from lime.lime_tabular import LimeTabularExplainer
explainer = LimeTabularExplainer(np.array(X_train),feature_names=X,class_names=[0,1])
exp = explainer.explain_instance(X_train.iloc[200,:],et.predict)
fig = exp.as_pypplot_figure()
我先用随机森林来预测,当我尝试应用石灰来解释时,解释器上出现了错误。参考另一篇文章,我认为概率的总和有问题(可能小于1)。由于这不是RNN,所以无法更改激活,期待您的帮助,谢谢~